多変量分布を用いた報酬予測による利害関係を考慮したマルチエージェント強化学習

Publication
第32回自律分散システム・シンポジウム