강화학습

바닥부터 배우는 강화 학습 2020

  • 마르코프 디시전 프로세스
  • 벨만 방정식
  • MDP를 알 때의 플래닝
    • 밸류 평가하기 Value Evaluation
  • MDP를 모를 때 밸류 평가하기
  • MDP를 모를 때 최고의 정책 찾기
  • 가치 기반 에이전트
    • Deep Q Learning
  • 정책 기반 에이전트

Last Modified: 2021/06/08 13:03:45

is a collection of Papers I have written.
© 2000 - Sang-Kil Park Except where otherwise noted, content on this site is licensed under a CC BY 4.0.
This site design was brought from Distill.