GitHub

Beta Policy

Reimplement the paper: Improving Stochastic Policy Gradients in Continuous Control with Deep Reinforcement Learning using the Beta Distribution on MountainCarContinuous-v0

Note that the model is not very stable, if you find any tricks that can make it stable, please keep me informed.

Reference: https://github.com/dennybritz/reinforcement-learning/blob/master/PolicyGradient/Continuous%20MountainCar%20Actor%20Critic%20Solution.ipynb

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
README.md		README.md
beta_policy.py		beta_policy.py
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Beta Policy

About

Releases

Packages

Languages

GoingMyWay/BetaPolicy

Folders and files

Latest commit

History

Repository files navigation

Beta Policy

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages