多変量分布を用いた報酬予測による利害関係を考慮したマルチエージェント強化学習

青谷拓海, 小林泰介, 杉本謙二

1月 2020

タイプ

収録

第32回自律分散システム・シンポジウム