mdp

This repository contains the implementation of a wide variety of Reinforcement Learning Projects in different applications of Bandit Algorithms, MDPs, Distributed RL and Deep RL. These projects include university projects and projects implemented due to interest in Reinforcement Learning.

reinforcement-learning deep-reinforcement-learning q-learning gym mdp deeprl bandit-algorithms on-policy off-policy multi-agent-reinforcement-learning distributed-reinforcement-learning network-routing stablebaselines3

Updated Feb 18, 2023
Jupyter Notebook

giacoballoccu / path-explanation-quality-guided-reasoning

Star

In- and post- process methods for optimizing explanations path based on newly defined quantitative explanation metrics

reinforcement-learning metrics knowledge-graph mdp recsys recommender-system knowledge-graph-completion recommender-systems knowledge-graph-embeddings knowledge-aware-recommendation knowledge-graphs explanation-quality explainations

Updated Oct 29, 2022
Python

makarbaderko / grid_world_rl

Star

MDP and Monte Carlo solution for maze solving

machine-learning reinforcement-learning maze mdp markov-decision-processes markov-chain-monte-carlo maze-solver

Updated Aug 27, 2020
Python

aditya-chayapathy / ai-pacman-agent

Star

AI Pacman Agent

python reinforcement-learning q-learning artificial-intelligence pacman mdp minimax searching expectimax

Updated Dec 14, 2017
Python

samre12 / spark-mdp

Star

Policy Evaluation and Iteration implementation in Spark for MDPs with sparse transition matrices

spark mdp

Updated Nov 20, 2017
Java

FurkanArslan / Checkers-Reinforcement-Learning

Star

A checkers reinforcement learning AI, and all the tools needed to train it.

reinforcement-learning mdp value-iteration

Updated Nov 15, 2017
Python

shamo0 / ValueIteration

Star

Program solves an MDP using value iteration

python algorithm reinforcement-learning ai mdp gridworld markov-decision-processes value-iteration

Updated Mar 29, 2021
Python

vaishn99 / MBPO-MDP

Star

A re-implementation of MBPO algorithm for MDP env.

mdp mbpo

Updated Feb 7, 2023
Jupyter Notebook

KaleabTessera / Gridworld-Markov-Decision-Process

Star

Implementing a gridworld from scratch and configuring it as a Markov decision process.

reinforcement-learning mdp gridworld markov-decision-processes

Updated Dec 8, 2022
Jupyter Notebook

danilo-archive / pacman-mdp-agent

Star

Implementation and statistical analysis of an AI agent capable of winning the arcade game of Pac-Man using an MDP solver that follows a policy based on Value Iteration.

ai pacman mdp stochastic berkley

Updated Jun 18, 2021
Python

shanigu / CostSensitive

Star

This project implements several methods for cost sensitive classification, based on a POMDP formalization, and an MDP formalization of the problem

mdp pomdp cost-sensitive-classification clasisfication

Updated Dec 22, 2022
C#

biodasturchi / gmx

Star

🔬 Gromacs yordamida molekular modellashtirish

topology gpu cuda mdp tpr gromacs trr

Updated May 11, 2023
Shell

Improve this page

Add a description, image, and links to the mdp topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the mdp topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

mdp

Here are 147 public repositories matching this topic...

prabhatnagarajan / birl

markkvdb / mdpsolver

danielakuinchtner / cp-mdp

danigfavero / inteligencia-artificial

Architjain128 / Value-Iteration

iamvigneshwars / ai-plays-frozen-lake

grzesiek2201 / MDPRL

Precioux / Pacman

amirhosein-mesbah / Reinforcement_learning

giacoballoccu / path-explanation-quality-guided-reasoning

makarbaderko / grid_world_rl

aditya-chayapathy / ai-pacman-agent

samre12 / spark-mdp

FurkanArslan / Checkers-Reinforcement-Learning

shamo0 / ValueIteration

vaishn99 / MBPO-MDP

KaleabTessera / Gridworld-Markov-Decision-Process

danilo-archive / pacman-mdp-agent

shanigu / CostSensitive

biodasturchi / gmx

Improve this page

Add this topic to your repo