ddlau / TRPO-GAE Public

forked from yjhong89/TRPO-GAE

Notifications You must be signed in to change notification settings
Fork 0
Star 0

Trust Region Policy Optimization with Generalized Advantage Estimator

0 stars 5 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
README.md		README.md
gae.py		gae.py
learn.py		learn.py
main.py		main.py
trpo.py		trpo.py
utils.py		utils.py

Repository files navigation

TRPO with GAE

Tensorflow implementation of TRPO(Trust Region Policy Optimization) with GAE(Generalized Advantage Estimator) on mujoco

Reference

About

Trust Region Policy Optimization with Generalized Advantage Estimator

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%