Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

joyrl #85

Open
1 of 2 tasks
johnjim0816 opened this issue Sep 28, 2022 · 13 comments
Open
1 of 2 tasks

joyrl #85

johnjim0816 opened this issue Sep 28, 2022 · 13 comments

Comments

@johnjim0816
Copy link

你是否已经阅读并同意《Datawhale开源项目行为准则》?

项目简介

该项目旨在开发一个强化学习的黑盒开源平台,并给读者呈现一个pip安装包的形式,让读者跳过复杂的强化算法和神经网络的设计,直接通过修改配置文件(yaml)来使用强化学习去解决相关任务。用户只需要对强化学习和深度学习有一个非常初步的认识就能够通过我们的平台解决相关问题。

立项理由

目前蘑菇书发行已经有一段时间,已经具有一定的读者基础,并深入了解了读者们更多的需求,也发现了更多的读者往往是非强化学习方向的交叉学科研究者,他们想将强化学习应用于各个领域,而苦于陷入强化学习算法设计的细节无法自拔。配合蘑菇书通俗讲解的一些概念,我们决定来开发这样一个平台帮助他们

项目受众

主要受众是想利用强化学习解决各类应用任务的交叉学科读者,其次是强化学习者

项目亮点

目前已有的项目主要有openai的spinninguprl和stable baselines,ray的RLlib以及清华的tianshou。
openai的spinninguprl目前的算法不是很全面,stable baselines虽然较为全面但是运行效率较低,对新手很不友好,且目前读者主要使用torch做人工智能相关的研究,stable baselines[torch]目前也比较残缺。RLlib弥补了在多线程并行方面的工作,但是仍然对新手或者交叉学科研究者不够友好,文档说明不够简单易用,且需要配置的东西有很多。
tianshou则有些华而不实的感觉。

项目规划

我们主要是实现各个算法以及补全一些常用的应用环境,主要工作内容如下:

  1. 以配置文件为基础的强化学习框架,即如何根据配置文件来设计网络
  2. 补全算法:包括单智能体强化学习、多智能体强化学习等等,我们旨在与时俱进,补全所有的流行算法
  3. pip安装包版本发行,目前还没有相关的经验
  4. 可视化编程平台(这个是比较超前的计划,可以面向诸如青少年等更多的受众,把我们的rl的easy发挥到极致!!!)

项目负责人

https://github.com/JohnJim0816
https://github.com/qiwang067
https://github.com/yyysjz1997

备注:发起立项申请后DOPMC将会在 72h 之内给出答复,如超时未答复请添加DOPMC负责人微信(微信号:at-Sm1les)问询~

  • 我已知悉上述备注
@finlay-liu
Copy link

同意

1 similar comment
@qiwang067
Copy link

同意

@ZhikangNiu
Copy link

可以给个简单的任务展示吗 : ) (同意

@mba1398
Copy link

mba1398 commented Sep 29, 2022

同意

@johnjim0816
Copy link
Author

可以给个简单的任务展示吗 : ) (同意

目前蘑菇书代码已经包含一些基础,最近在写配置文件框架

@zhanhao93
Copy link

同意

3 similar comments
@ruyiluo
Copy link

ruyiluo commented Oct 8, 2022

同意

@zhanhao93
Copy link

同意

@skywateryang
Copy link

同意

@andongBlue
Copy link

同意
建议以项目规划的第一和第二目标完成为主。
第三部分我们好像还没有成功的产品,期待可以大获成功。
第四部分可以先不作为立项内容,与目前主计划距离较远。该规划可以在完成其他目标后再单独立项

@GYHHAHA
Copy link

GYHHAHA commented Oct 9, 2022

同意

@johnjim0816
Copy link
Author

同意 建议以项目规划的第一和第二目标完成为主。 第三部分我们好像还没有成功的产品,期待可以大获成功。 第四部分可以先不作为立项内容,与目前主计划距离较远。该规划可以在完成其他目标后再单独立项

目前我们的想法也正如此

@Sm1les
Copy link
Contributor

Sm1les commented Oct 12, 2022

同意

@Sm1les Sm1les changed the title easyrl 强化学习工具包:joyrl Oct 12, 2022
@Sm1les Sm1les changed the title 强化学习工具包:joyrl joyrl Sep 1, 2023
@Sm1les Sm1les added the 立项 label Dec 14, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment