多変量分布を用いた報酬予測による利害関係を考慮したマルチエージェント強化学習

青谷拓海, 小林泰介, 杉本謙二

January 2020

Type

Domestic Conference

Publication

第32回自律分散システム・シンポジウム