2018-07-10から1日間の記事一覧

「動物は何を報酬として行動しているのか」が逆強化学習で明らかになる

www.kyoto-u.ac.jp 一般に強化学習というと、 どの状況でどれくらい報酬を得られるのかはあらかじめ決められており、試⾏錯誤によって得られる報酬を最⼤化する⾏動戦略を⾒つけ出す 機械学習のモデルであるが、逆強化学習は 動物はすでに最適な⾏動戦略を獲…