主要收录NLP竞赛策略实现、各任务教程、经验贴、学习资料以及会议时间等,如果对你有帮助,请给我们一个star。
本项目主要包含以下内容:
- NLPer-Arsenal-Code (2021.12)
- NLPer-Arsenal-Post(2021.03)
- 其它
项目正在不断完善,如果您有什么建议,欢迎到issue 留言,或者通过添加 wx:mlc2060 联系我们。
所有内容均由我们从网络公开资料中收集整理得到,版权归原作者所有,如有侵权请立即与我们联系,我们将及时处理。
整理不易,转载时请务必备注本项目github链接,感谢您为维护良好的开源环境出一份力。
一个专注于分享大模型、算法实战、学术论文、面试攻略的公众号,免费提供技术交流群,关注公众号:机器学习社区,与我们一起成长。
分享前沿技术资讯、算法实战项目、求职内推、算法竞赛、算法面试攻略、面试经验交流(校招、社招、实习)等,与 10000+来自港大、北大、清华、中科院、CMU、腾讯、百度、微软等名校名企开发者互动交流~
记录当前正在进行的竞赛,奖金丰厚,适合有一定基础的NLPer;结束时间为官网标准时间或会议召开时间。
领域/会议 | 竞赛 | 报名时间 | 结束时间 |
---|---|---|---|
文本生成 | 千言:第二届面向事实一致性的生成评测比赛 (文案生成、摘要生成、对话生成) | -2023.3.31 | 2023.7.16 |
DSTC11 | Track 4:Robust and Multilingual Automatic Evaluation Metrics for Open-Domain Dialogue Systems Track 5:Task-oriented Conversational Modeling with Subjective Knowledge |
-2023.3 | 2023.8-9 |
CCKS2023 | 主题一:图谱构建与信息抽取 任务1:开放环境下的知识图谱构建与补全(task1 ,task2 ) 任务2:面向金融领域的主体事件检测 任务3:面向上市公司主营业务的实体链接 主题二:知识推理问答 任务4:开放领域知识图谱问答 任务5:外军无人系统知识图谱推理问答 主题三:知识存储管理 任务6:基于图数据库的自定义图分析算法评测 |
-2023.7,详见各任务要求 | 2023.8.27 |
CCMT2023 | CCMT与WMT2023合作组织的汉英、英汉新闻领域的翻译评测 维汉、蒙汉、藏汉的翻译评测 翻译质量估计评测 自动译后编辑评测 一带一路”低资源语言机器翻译任务 以中文为中心的多语言机器翻译任务 中英零指代机器翻译任务 |
-2023.5.10 | 2023.10 |
CCL2023 | Track 1: 古籍命名实体识别评测(GuNER 2023) Track 2: 第三届中文抽象语义表示解析评测(CAMRP 2023) Track 3: 汉语框架语义解析评测 Track 4: 第三届中文空间语义理解评测(SpaCE 2023) Track 5: 跨领域句子级别中文省略消解评测(MCER 2023) Track 6: 电信网络诈骗案件分类(FCC) Track 7: 汉语学习者文本纠错(CLTC) Track 8: 中小学作文流畅性评价 Track 9: 汉语高考阅读理解对抗鲁棒评测 |
-2023.5,详见各任务要求 | 2023.8.5 |
NLPCC 2023 | Track 1:Chinese Grammatical Error Correction Track 2:Multi-perspective Scientific Machine Reading Comprehension Track 3:Math Word Problem Solving Track 4:Conversational Aspect-based Sentiment Quadruple Analysis Track 5:Chinese Medical Instructional Video Question Answering Track 6:Chinese Few-shot and Zero-shot Entity Linking Track 7:Chinese Essay Discourse Coherence Evaluation Track 8:Chinese Spelling Check Track 9:User Feedback Prediction and Response Generation Track 10:Learn to Watch TV: Multimodal Dialogue Understanding and Response Prediction |
-2023.4,详见各任务要求 | 2023.6 |
千言数据集 | 文本生成、情感分析、阅读理解、中文对话、文本相似度、语义解析、机器同传、信息抽取、实体链指、低资源语言翻译、自然语言推理、事实核查、可解释评测、段落检索、视频语义理解等15个任务60个数据集 | 现在 | 暂无 |
中文医疗信息处理挑战榜CBLUE | 目前任务包括医学文本信息抽取(实体识别、关系抽取)、医学术语归一化、医学文本分类、医学句子关系判定和医学QA共5大类任务8个子任务,-> 官网 | 现在 | 暂无 |
记录长期进行的训练赛,有排行榜,方便刚入门的NLPer练手
这里记录整理好的竞赛,包含数据下载以及竞赛方案
NLP相关的学界、业界、理论、实践以及时事动态
平台 | 主要领域 | 自媒体 |
---|---|---|
微信公众号 | 技术 | 机器学习社区、Coggle数据科学、DataFunTalk(偏向业界方案) |
行业信息 | 机器学习社区、机器之心、机器之能、AI报道、AI前线、AI科技评论、机器学习研究组订阅 | |
学术 | 机器学习社区、PaperWeekly、智源社区、人工智能前沿讲习、专知、AINLP、AI TIME 论道、夕小瑶的卖萌屋 | |
BiliBili | 前沿论坛 | 智源社区、AITIME论道 |
基础 | 跟李沐学AI | |
网站 | 竞赛 | Coggle数据科学 、CompHub |
学术 | Paper With Code |
warning: 请仔细评估第三方平台信誉,警惕代码、数据等重要信息泄露
平台 | 算力 | 价格 | 说明 |
---|---|---|---|
featurize | 2080Ti、3090 | 2080Ti(¥2/h)、3090(¥3.6/h) | 镜像环境,使用灵活,可以通过jupyter_lab、vscode、pycharm远程连接 |
AutoDL | rtx a5000、3090、A100 | ¥0.6/h~¥8.5/h | 单机ssh连接,存储空间不大,不过很便宜 |
智星云 | 1080Ti、3080、3090、V/A100等 | ¥2.1/h~¥11/h | 整机,可远程连接(pycharm/vs code) |
沣云平台 | ML270 | ¥2.8/h | 一站式AI计算平台,CPU可以增量配置,按运行时间收取费用 |
恒源云 | 2080Ti、3060、3090、V100等 | ¥1.25/h~¥5.5/h | 可以搭配完整的CPU和硬盘,相比bithub有更高的自由度,目前处于推广期,有很多优惠 |
并行云 | V100、2080Ti、P100等 | 不明 | 计算节点来自超算,可个性化定制CPU核数、GPU、存储空间,有非常简便的操作界面,并且提供远程linux桌面,灵活度优于以上三个平台。目前处于推广期,有很多优惠 |
AI Studio | V100 | 基本免费 | 由百度开发, 偶尔申请不到V100,最高可免费8卡。主要使用飞桨PaddlePaddle框架,其它框架需自行折腾,也可用X2Paddle一键转为飞桨的代码和模型,大部分比赛参与即送算力卡。 |
天池DSW | p100 | 免费,单次限时8小时,不限次数 | 阿里的一个在线平台,运行时不能关闭 |
天池实验室 | V100 | 免费,60h/年 | 相比于AI Studio不限制深度学习框架,就是时间比较短 |
Kaggle | k80 | 免费,每周限时30小时 | 外网访问 |
Google Colab | k80、T4、P4、P100 | 免费,单次限时12小时 | 外网访问,无法指定具体GPU,未订阅Colab Pro用户多数时间下估计会被分配k80 |
- CompHub :一站式聚合国内外竞赛
- 阿里天池 :阿里,奖金丰厚
- AI Studio :百度AI Studio深度学习社区,成绩优异可获得飞桨开发者技术专家(PPDE) 认证申请绿色通道。
- 讯飞开发平台 :科大讯飞,每年下半年至10.24会举办大量赛事
- Codalab :国外数据科学竞赛
- DataFountain : CCF指定专业大数据及人工智能竞赛平台,有很多训练赛
- DCLab :和天池比较像,学校政府举办的竞赛多一些
- Kaggle :偶尔会有NLP竞赛
- biendata : 国内领先的人工智能竞赛平台,包含大量NLP学术评测
- FlyAI-AI竞赛服务平台 :难度分为新手、简单、中等、精英、困难,有大量GPU算力可供获取,奖金不多,但适合练手
- 和鲸社区 :一个综合的学习平台 ,偏向政府企业类竞赛
- ACL、EMNLP、AAAI、NLPCC、CCL、CCKS、SMP等会议每年都会举办相关学术评测
- AI研习社 :很多很多NLP竞赛
中国计算机学会推荐国际学术会议和期刊目录-2022
中国计算机学会推荐中文科技期刊目录
dblp:计算机科学文献库
AI会议deadline :会议倒计时
会议时间记录表 :Updated by Jackie Tseng, Tsinghua Computer Vision and Intelligent Learning Lab
note:以下时间为官网默认时间,暂未换算成北京时间
会议 | 级别 | 摘要截稿 | 原文截稿 | 审稿通知 | 开会时间 | 说明 |
---|---|---|---|---|---|---|
ICLR(官网、dblp) | * | 2023.5.1-5.3 | Kigali Rwanda | |||
ACL(官网、dblp) | CCF-A | 2023.2.15(review)、2023.5.1(final) | 2023.7.9-7.14 | Toronto,Canada | ||
NeurIPS(官网、dblp) | CCF-A | 2023.5.11 | 2023.5.17 | 2023.9.21 | 2023.12.10-12.16 | New Orleans Ernest N. Morial Convention Center |
ICML(官网、dblp) | CCF-A | * | 2023.4.22 | 2023.7.23-7.29 | Honolulu, Hawaii,USA | |
SIGIR(官网、dblp) | CCF-A | 2023.7.23-7.27 | Taipei, Taiwan | |||
WWW(官网、dblp) | CCF-A | 2023.1.25(final) |
2023.4.30-5.4 | AUSTIN, TEXAS, USA | ||
AAAI(官网、dblp) | CCF-A | Washington | ||||
IJCAI(官网、dblp) | CCF-A | 2023.2.24(summary reject notification)、2023.4.19(paper notification) | 2023.8.19-8.25 | Cape Town, South Africa | ||
EMNLP(官网、dblp) | CCF-B | 2022.6.16 | 2023.6.23(Direct)、2023.7.21(ARR) | 2023.8.22~8.28(rebuttal)、2023.10.6 | 2023.12.6-12.10 | Singapore |
NAACL(官网、dblp) | CCF-B | * | * | * | * | 合并至ACL2023 |
COLING(官网、dblp) | CCF-B | * | Gyeongju, Korea | |||
CoNLL(官网、dblp) | CCF-C | * | same as emnlp、online | |||
NLPCC(官网、dblp) | CCF-C | * | 2023.5.15 | 2023.7.17 | 2023.10.12-10.15 | 佛山 |
IJCNN(官网 、dblp ) | CCF-C | * | 2023.6.18-6.23 | Queensland, Australia | ||
ICONIP(官网) | CCF-C | * | New Delhi, India | |||
ACML(官网) | CCF-C | * | 2023.6.23(会议) 2023.5.26(期刊) |
2023.8.11-8.18(rebuttal)、9.8 (final); 2023.7.7(初审)、9.8(final) |
2023.11.11-11.14 | İstanbul, Turkey |
AACL(官网) | * | * | 2022.9.20 (final) |
台北 | ||
EACL(官网、dblp) | * | * | 2023.5.2-5.6 | Kiev, Ukraine、online | ||
CCL(官网、dblp) | * | * | 2023.5.20 | 2023.8.3-8.5 | 哈尔滨 | |
CCKS(官网、dblp) | * | * | 2023.5.19 | 2023.6.30 | 2023.8.24~8.27 | 沈阳 |
SMP(官网、dblp) | * | * | 2023.5.15 | 2023.7.1 | 2023.11.24-11.26 | 北京 |
CCMT(官网) | * | * | ? | ? | 2023.10 | 山东济南 |