学位論文

Langevin Dynamicsに基づく強化学習の最適化アルゴリズム

越野 壮太
(指導教員:泉田 勇輝 講師/ 数理情報第8研究室

研究概要

近年,強化学習に対する最適化アルゴリズムである自然方策勾配法をLangevin Dynamicsに基づいて解析する手法が提案された.本研究では,そのLangevin Dynamicsの手法を発展させ,最適化アルゴリズムを考えた.

既存アルゴリズムと提案アルゴリズムの方策の挙動


卒論の感想

ページトップへ