Release PaddleNLP 2.7.0 Release Note · PaddlePaddle/PaddleNLP

很高兴地通知大家，飞桨大模型套件发布v2.7.0版本。这个版本中，我们深入优化套件的大模型能力。从易用性、性能、到稳定性都有巨大提升。

总体而言，当前版本更新有以下亮点：

统一工具链大模型入口。统一预训练、精调、压缩、推理以及部署等环节的实现代码，到 PaddleNLP/llm目录。
全新大模型工具链文档。一站式指引用户从大模型入门到业务部署上线。文档见： https://paddlenlp.readthedocs.io/zh/latest/llm/finetune.html
全断点存储机制 Unified Checkpoint。在存储断点时将模型权重、优化器权重等进行统一safetensors格式存储，不再区分分布式策略存储，并且支持恢复训练的动态扩缩容，大大提高大模型存储的通用性。
高效微调升级。支持了高效微调+LoRA同时使用，支持了QLoRA等算法。

大模型训推全流程

在大模型背景下，通常我们需要进行多卡分布式的训练，在保存Checkpoint时所得到的模型权重通常是分片放置的，例如根据张量并行、流水线并行进行切分保存。这种根据分布式策略直接存储Checkpoint的方式非常直接明了，但也存在如下的问题：
- 对下游推理不够友好，当用户希望获取中间阶段保存的Checkpoint做下游推理时，需要手动对模型权重进行合并。
- 不利于应对做恢复训练时，可能会面临的分布式策略改变、训练节点数发生变化的情况。用户往往需要手动对Checkpoint进行处理，增加了操作复杂度。
为了最大程度地解决上述的问题，降低用户操作难度，我们对大模型存储框架进行了升级，提出了大模型统一存储方案——Unified Checkpoint。Unified Checkpoint的核心思想是将模型权重、优化器权重等进行统一safetensors格式存储，在Checkpoint存储时不再对分布式策略进行区分，提高大模型存储的通用性。
Unified Checkpoint具备以下功能与特点：
- 权重存储不区分分布式策略，并采用safetensors格式统一存储；
- 灵活支持大模型训练扩容、缩容等各种情况，能够适配不同分布式训练策略的切换。

Trainer 升级
- 支持了 "--skip_memory_metrics 0"是，显示实时显存、内存占用
- 支持 "--unified_checkpoint" "--unified_checkpoint_config" 支持混合并行下模型save，动态扩缩容重启。
新增 PretrainModelPipe基础类，支持流水线并行训练。
其他支持
支持了paddlenlp commit id 展示 paddlenlp.version.commit
支持AI Studio download add save to aistudio hub

@Wennie396 made their first contribution in #6897
@Wong4j made their first contribution in #7008
@yuanlehome made their first contribution in #7080
@Xreki made their first contribution in #7105
@Tom-Zheng made their first contribution in #7092
@TimeYWL made their first contribution in #7122
@From00 made their first contribution in #7168
@RichardWooSJTU made their first contribution in #7186
@heavyrain-lzy made their first contribution in #7269
@LokeZhou made their first contribution in #7337
@JZ-LIANG made their first contribution in #7301
@WAI-clear made their first contribution in #7402
@tianhaodongbd made their first contribution in #7293
@zzjjay made their first contribution in #7504
@anexplore made their first contribution in #7558
@niuliling123 made their first contribution in #7528
@zxcd made their first contribution in #7577
@MayYouBeProsperous made their first contribution in #7575
@iosmers made their first contribution in #7613
@AndSonder made their first contribution in #7343
@zhink made their first contribution in #7679
@kingTLE made their first contribution in #7708
Full Changelog: v2.6.1...v2.7.0