关于VisualGLM训练的各种Tricks #5

WangRongsheng · 2023-05-26T15:03:13Z

WangRongsheng
May 26, 2023
Maintainer

如果数据多的话可以考虑增加训练的参数，目前的训练脚本只训练了2层lora：THUDM/VisualGLM-6B#61 (comment)

WangRongsheng · 2023-05-28T15:13:20Z

WangRongsheng
May 28, 2023
Maintainer Author

大模型训练中，训练的精度（int4，int8，float16...）不重要，模型的参数（6B、13B...）很影响模型的性能。

0 replies

freelancerllm · 2023-05-30T09:28:48Z

freelancerllm
May 30, 2023

目前glm系列的模型目前就6B。

1 reply

WangRongsheng May 30, 2023
Maintainer Author

目前glm系列的模型目前就6B。

是的，希望后面会有一些大参数的模型出来。

WangRongsheng · 2023-05-30T09:52:53Z

WangRongsheng
May 30, 2023
Maintainer Author

使用QLoRA最低显存要求9.8G，可以多卡，可以将脚本里的--include localhost:0改成你想使用的卡，比如--include localhost:0,1,2，或者直接去掉这个参数，就是使用所有卡了：THUDM/VisualGLM-6B@5d368f6#commitcomment-115614063

0 replies

WangRongsheng · 2023-05-30T11:32:00Z

WangRongsheng
May 30, 2023
Maintainer Author

0 replies

WangRongsheng · 2023-06-12T06:43:02Z

WangRongsheng
Jun 12, 2023
Maintainer Author

支持多轮对话finetune：THUDM/VisualGLM-6B#118

0 replies

WangRongsheng · 2023-07-15T15:31:52Z

WangRongsheng
Jul 15, 2023
Maintainer Author

关于微调图片的大小问题：THUDM/VisualGLM-6B#82

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于VisualGLM训练的各种Tricks #5

{{title}}

Replies: 6 comments 1 reply

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

关于VisualGLM训练的各种Tricks #5

WangRongsheng May 26, 2023 Maintainer

Replies: 6 comments · 1 reply

WangRongsheng May 28, 2023 Maintainer Author

freelancerllm May 30, 2023

WangRongsheng May 30, 2023 Maintainer Author

WangRongsheng May 30, 2023 Maintainer Author

WangRongsheng May 30, 2023 Maintainer Author

WangRongsheng Jun 12, 2023 Maintainer Author

WangRongsheng Jul 15, 2023 Maintainer Author

WangRongsheng
May 26, 2023
Maintainer

Replies: 6 comments 1 reply

WangRongsheng
May 28, 2023
Maintainer Author

freelancerllm
May 30, 2023

WangRongsheng May 30, 2023
Maintainer Author

WangRongsheng
May 30, 2023
Maintainer Author

WangRongsheng
May 30, 2023
Maintainer Author

WangRongsheng
Jun 12, 2023
Maintainer Author

WangRongsheng
Jul 15, 2023
Maintainer Author