PaddleNLP v2.1.0
New Features
- 新增开箱即用的工业级NLP能力Taskflow,预置中文分词、词性标注、专名识别、句法分析、情感分析、文本纠错等8个任务,更多使用说明请参考Taskflow文档。
- 新增基于Promot Tuning的NLP小样本学习应用实例,配合R-Drop策略显著提升效果,更多技术细节请参考FewCLUE。
- 集成FasterTransformer加速能力,显著提升翻译、对话等文本生成任务的推理速度。支持Transformer/GPT/BART等主流生成结构与Beam Search与Sampling-based解码策略,更多使用说明请参考FasterTransformer使用文档。
New Examples
- 新增无监督语义匹配模型SimCSE。
- 新增模型压缩策略MiniLMv2。
- 新增文本纠错模型ERNIE-CSC。
- 新增句法分析应用示例dependency_parsing。
- 新增小样本学习应用示例few_shot。
- 新增文本摘要应用示例BART。
- 完善ERNIE-1.0/GPT/GPT-3的多机分布式预训练代码。@zhaoyinglia @wangxicoding
New Pretrained Models
- 新增RoFormer模型 #804 ,感谢 @JunnYu 的贡献🎉。
- 新增ConvBert模型 #819,感谢 @JunnYu 的贡献🎉。
- 新增MPNet模型 #869,感谢 @JunnYu 的贡献🎉。
New Dataset
- 新增文本摘要数据集CNN/DailyMail #1061。
Bug Fix
- 修复维特比解码在长度为1的输入下预测不准确的问题 #1126 。
- 修复词法分析模型的计算精度问题 #962 。
- 修复Tokenizer计算offset mapping时对特殊字符处理的问题 #882,感谢 @JunnYu 的贡献🎉。
- 修复Windows环境下出现的int类型变量错误 #856 #1023 #1146。
Docs
- 优化Transformer API Reference文档,更加清晰准确易懂。感谢 @huhuiwen99 的贡献🎉。
New Contributors
- @huhuiwen99 made their first contribution in #914 🎉
- @iamqiz made their first contribution in #950 🎉
- @ForFishes made their first contribution in #986 🎉
- @AI-Mart made their first contribution in #1009 🎉
- @zhaoyinglia made their first contribution in #1064 🎉