ymcui · ymcui · Aug 28, 2023 · Aug 23, 2023 · Aug 23, 2023 · Aug 23, 2023
diff --git a/scripts/langchain/langchain_qa.py b/scripts/langchain/langchain_qa.py
@@ -37,7 +37,7 @@
     "现在还有一些文字，（如果有需要）你可以根据它们完善现有的回答。"
     "\n\n"
     "{context_str}\n"
-    "\\nn"
+    "\n\n"
     "请根据新的文段，进一步完善你的回答。"
     " [/INST]"
 )

diff --git a/scripts/training/run_clm_pt_with_peft.py b/scripts/training/run_clm_pt_with_peft.py
@@ -575,6 +575,17 @@ def group_texts(examples):
             lora_dropout=lora_dropout,
             modules_to_save=modules_to_save)
         model = get_peft_model(model, peft_config)
+
+    if training_args.gradient_checkpointing and \
+        (not model.modules_to_save or 'embed_tokens' not in model.modules_to_save):
+        # enable requires_grad to avoid exception during backward pass when using gradient_checkpoint without tuning embed.
+        if hasattr(model.base_model, "enable_input_require_grads"):
+            model.base_model.enable_input_require_grads()
+        elif hasattr(model.base_model, "get_input_embeddings"):
+            def make_inputs_require_grad(_module, _input, _output):
+                _output.requires_grad_(True)
+            model.base_model.get_input_embeddings().register_forward_hook(make_inputs_require_grad)
+
     model.print_trainable_parameters()
     old_state_dict = model.state_dict
     model.state_dict = (

diff --git a/scripts/training/run_clm_sft_with_peft.py b/scripts/training/run_clm_sft_with_peft.py
@@ -382,6 +382,16 @@ def main():
             modules_to_save=modules_to_save)
         model = get_peft_model(model, peft_config)
 
+    if training_args.gradient_checkpointing and \
+        (not model.modules_to_save or 'embed_tokens' not in model.modules_to_save):
+        # enable requires_grad to avoid exception during backward pass when using gradient_checkpoint without tuning embed.
+        if hasattr(model.base_model, "enable_input_require_grads"):
+            model.base_model.enable_input_require_grads()
+        elif hasattr(model.base_model, "get_input_embeddings"):
+            def make_inputs_require_grad(_module, _input, _output):
+                _output.requires_grad_(True)
+            model.base_model.get_input_embeddings().register_forward_hook(make_inputs_require_grad)
+
     #model.base_model.tie_weights()
     model.print_trainable_parameters()
     logger.info(f"model.modules_to_save: {model.modules_to_save}")