joyrl #85

johnjim0816 · 2022-09-28T03:38:24Z

你是否已经阅读并同意《Datawhale开源项目行为准则》？

我已阅读并同意《Datawhale开源项目行为准则》

项目简介

该项目旨在开发一个强化学习的黑盒开源平台，并给读者呈现一个pip安装包的形式，让读者跳过复杂的强化算法和神经网络的设计，直接通过修改配置文件(yaml)来使用强化学习去解决相关任务。用户只需要对强化学习和深度学习有一个非常初步的认识就能够通过我们的平台解决相关问题。

立项理由

目前蘑菇书发行已经有一段时间，已经具有一定的读者基础，并深入了解了读者们更多的需求，也发现了更多的读者往往是非强化学习方向的交叉学科研究者，他们想将强化学习应用于各个领域，而苦于陷入强化学习算法设计的细节无法自拔。配合蘑菇书通俗讲解的一些概念，我们决定来开发这样一个平台帮助他们

项目受众

主要受众是想利用强化学习解决各类应用任务的交叉学科读者，其次是强化学习者

项目亮点

目前已有的项目主要有openai的spinninguprl和stable baselines，ray的RLlib以及清华的tianshou。
openai的spinninguprl目前的算法不是很全面，stable baselines虽然较为全面但是运行效率较低，对新手很不友好，且目前读者主要使用torch做人工智能相关的研究，stable baselines[torch]目前也比较残缺。RLlib弥补了在多线程并行方面的工作，但是仍然对新手或者交叉学科研究者不够友好，文档说明不够简单易用，且需要配置的东西有很多。
tianshou则有些华而不实的感觉。

项目规划

我们主要是实现各个算法以及补全一些常用的应用环境，主要工作内容如下：

以配置文件为基础的强化学习框架，即如何根据配置文件来设计网络
补全算法：包括单智能体强化学习、多智能体强化学习等等，我们旨在与时俱进，补全所有的流行算法
pip安装包版本发行，目前还没有相关的经验
可视化编程平台（这个是比较超前的计划，可以面向诸如青少年等更多的受众，把我们的rl的easy发挥到极致！！！）

项目负责人

https://github.com/JohnJim0816
https://github.com/qiwang067
https://github.com/yyysjz1997

备注：发起立项申请后DOPMC将会在 72h 之内给出答复，如超时未答复请添加DOPMC负责人微信（微信号：at-Sm1les）问询~

我已知悉上述备注

finlay-liu · 2022-09-28T06:16:05Z

同意

qiwang067 · 2022-09-28T06:16:20Z

同意

ZhikangNiu · 2022-09-29T10:30:47Z

可以给个简单的任务展示吗 : ) （同意

mba1398 · 2022-09-29T14:06:43Z

同意

johnjim0816 · 2022-09-30T06:36:53Z

可以给个简单的任务展示吗 : ) （同意

目前蘑菇书代码已经包含一些基础，最近在写配置文件框架

zhanhao93 · 2022-10-01T07:31:18Z

同意

ruyiluo · 2022-10-08T02:14:29Z

同意

zhanhao93 · 2022-10-09T06:05:46Z

同意

skywateryang · 2022-10-09T13:39:59Z

同意

andongBlue · 2022-10-09T14:33:12Z

同意
建议以项目规划的第一和第二目标完成为主。
第三部分我们好像还没有成功的产品，期待可以大获成功。
第四部分可以先不作为立项内容，与目前主计划距离较远。该规划可以在完成其他目标后再单独立项

GYHHAHA · 2022-10-09T15:00:43Z

同意

johnjim0816 · 2022-10-10T08:35:55Z

同意建议以项目规划的第一和第二目标完成为主。第三部分我们好像还没有成功的产品，期待可以大获成功。第四部分可以先不作为立项内容，与目前主计划距离较远。该规划可以在完成其他目标后再单独立项

目前我们的想法也正如此

Sm1les · 2022-10-12T15:06:13Z

同意

johnjim0816 added the 立项申请 label Sep 28, 2022

johnjim0816 assigned andongBlue, finlay-liu, GYHHAHA, mba1398, ZhikangNiu, qiwang067, ruyiluo, skywateryang, Sm1les and zhanhao93 Sep 28, 2022

Sm1les removed the 立项申请 label Oct 12, 2022

Sm1les changed the title ~~easyrl~~ 强化学习工具包：joyrl Oct 12, 2022

Sm1les changed the title ~~强化学习工具包：joyrl~~ joyrl Sep 1, 2023

Sm1les added the 立项 label Dec 14, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

joyrl #85

joyrl #85

johnjim0816 commented Sep 28, 2022

finlay-liu commented Sep 28, 2022

qiwang067 commented Sep 28, 2022

ZhikangNiu commented Sep 29, 2022

mba1398 commented Sep 29, 2022

johnjim0816 commented Sep 30, 2022

zhanhao93 commented Oct 1, 2022

ruyiluo commented Oct 8, 2022

zhanhao93 commented Oct 9, 2022

skywateryang commented Oct 9, 2022

andongBlue commented Oct 9, 2022

GYHHAHA commented Oct 9, 2022

johnjim0816 commented Oct 10, 2022

Sm1les commented Oct 12, 2022

joyrl #85

joyrl #85

Comments

johnjim0816 commented Sep 28, 2022

你是否已经阅读并同意《Datawhale开源项目行为准则》？

项目简介

立项理由

项目受众

项目亮点

项目规划

项目负责人

备注：发起立项申请后DOPMC将会在 72h 之内给出答复，如超时未答复请添加DOPMC负责人微信（微信号：at-Sm1les）问询~

finlay-liu commented Sep 28, 2022

qiwang067 commented Sep 28, 2022

ZhikangNiu commented Sep 29, 2022

mba1398 commented Sep 29, 2022

johnjim0816 commented Sep 30, 2022

zhanhao93 commented Oct 1, 2022

ruyiluo commented Oct 8, 2022

zhanhao93 commented Oct 9, 2022

skywateryang commented Oct 9, 2022

andongBlue commented Oct 9, 2022

GYHHAHA commented Oct 9, 2022

johnjim0816 commented Oct 10, 2022

Sm1les commented Oct 12, 2022