学習グループ

逆強化学習によるロボットの自律的な動作獲得

  ロボットが自律的に環境に適応する機能は,人とロボットが共生していくうえで重要な役割を担っており,盛んに研究が行われてきました.近年では逆強化学習と呼ばれる,強化学習に用いる報酬関数を熟練者の動作から推定する手法が注目されています.本研究では,熟練者にかかる負担の軽減を目的として,ロボットによる任意の動作に対して熟練者が付与するスコアから報酬関数を推定する逆強化学習手法の構築などを行っています.


-関連論文-