Skip to content

通过阅读论文Attention is all you need来复现Transformer模型

Notifications You must be signed in to change notification settings

scnu-dil/Reproduce_the_Transformer_model

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

通过阅读论文Attention is all you need来复现Transformer模型

已完成

  • 输入数据处理部分
  • transformer模型的训练部分
  • transformer模型的验证部分
  • transformer模型的推理部分
  • 输出数据生成部分

待完成

  • 将当前代码拆分为各个模块
  • 添加对模型训练部分,测试部分困惑度PPL和准确率ACC的图
  • 优化模型代码,添加更多注释
  • 构造输入参数约束函数
  • 添加命令行参数模式
  • 添加参考论文和代码的链接
  • 训练模型结束保存模型

使用方法

  • 当前就直接运行'all.py'文件即可;
  • 'CUDA_VISIBLE_DEVICES=0 python all.py',指定GPU显卡来运行模型,'all.py'文件包括模型训练,验证和推理三个功能;
  • 可以在'parameters.py'文件中修改模型的全部参数。

注意

About

通过阅读论文Attention is all you need来复现Transformer模型

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages