05-Qwen-7B-Chat Ptuning 微调

Ptuning原理

数据加载与模型配置与LoRa一致,在此具体讲一下Ptuning的细节:
基本原理为冻结主模型全部参数,在训练数据前加入一小段Prompt,之训练Prompt的嵌入层。在Ptuning中，只有soft prompt,是自动学习的,不用人工设置。

在Prompt-tuning的时候，前面只是增加了一个Prompt Embedding.
在Ptuning这里替换为了Prompt Encoder，新加了LSTM/MLP+Embedding.

Ptuning PEFT模块

PromptEncoderReparameterizationType来决定到底是用LSTM还是MLP
可调的参数有：num_virtual_tokens、encoder_reparameterization_type、encoder_dropout、encoder_num_layers、encoder_hidden_size
注意,encoder_num_layers设置层数,但MLP设置层数固定为2,此参数只对LSTM时有效。

from peft import PromptEncoderConfig, TaskType, get_peft_model, PromptEncoderReparameterizationType

config = PromptEncoderConfig(task_type=TaskType.CAUSAL_LM, num_virtual_tokens=10,
                             encoder_reparameterization_type=PromptEncoderReparameterizationType.MLP,
                             encoder_dropout=0.1, encoder_num_layers=5, encoder_hidden_size=1024)
config
'''
PromptEncoderConfig(peft_type=<PeftType.P_TUNING: 'P_TUNING'>, auto_mapping=None, base_model_name_or_path=None, revision=None, task_type=<TaskType.CAUSAL_LM: 'CAUSAL_LM'>, inference_mode=False, num_virtual_tokens=10, token_dim=None, num_transformer_submodules=None, num_attention_heads=None, num_layers=None, encoder_reparameterization_type=<PromptEncoderReparameterizationType.MLP: 'MLP'>, encoder_hidden_size=1024, encoder_num_layers=5, encoder_dropout=0.1)
'''

其余可见目录下微调脚本

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

05-Qwen-7B-Chat Ptuning 微调.md

05-Qwen-7B-Chat Ptuning 微调.md

05-Qwen-7B-Chat Ptuning 微调

Ptuning原理

Ptuning PEFT模块

Files

05-Qwen-7B-Chat Ptuning 微调.md

Latest commit

History

05-Qwen-7B-Chat Ptuning 微调.md

File metadata and controls

05-Qwen-7B-Chat Ptuning 微调

Ptuning原理

Ptuning PEFT模块