Super Mario Bros RL

Advantage Actor critic [1]
Parallel Advantage Actor critic [2]
Noisy Networks for Exploration [3]
Proximal Policy Optimization Algorithms [4]
Curiosity-driven Exploration by Self-supervised Prediction [5] (WIP)
'Random Network Distillation' pytorch model
'Curiosity-driven Exploration' pytorch model

1. Setup

Requirements

2. How to Train

Modify the parameters in mario_a2c.py as you like.

python3 mario_a2c.py

or

python3 mario_ppo.py

3. How to Eval

Modify the is_load_model, is_render parameters in mario_a2c.py as you like.

python3 mario_a2c.py

or

python3 mario_ppo.py

4. Loss/Reward Graph

It use just A2C(PAAC)

It use just ICM and no ext reward.(Curiosity-driven)

References

[1] Actor-Critic Algorithms
[2] Efficient Parallel Methods for Deep Reinforcement Learning
[3] Noisy Networks for Exploration
[4] Proximal Policy Optimization Algorithms
[5] Curiosity-driven Exploration by Self-supervised Prediction

Name		Name	Last commit message	Last commit date
Latest commit History 100 Commits
asset		asset
models		models
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
atari_a2c.py		atari_a2c.py
atari_ppo.py		atari_ppo.py
autopep8.sh		autopep8.sh
cartpole_a2c.py		cartpole_a2c.py
mario_a2c.py		mario_a2c.py
mario_curio.py		mario_curio.py
mario_ppo.py		mario_ppo.py
model.py		model.py
train.sh		train.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Super Mario Bros RL

1. Setup

Requirements

2. How to Train

3. How to Eval

4. Loss/Reward Graph

References

About

Releases

Packages

Languages

License

jcwleo/mario_rl

Folders and files

Latest commit

History

Repository files navigation

Super Mario Bros RL

1. Setup

Requirements

2. How to Train

3. How to Eval

4. Loss/Reward Graph

References

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages