青谷拓海 / Takumi Aotani
青谷拓海 / Takumi Aotani
プロフィール
ニュース
研究内容
研究業績
教育業績
コンタクト
ライト
ダーク
自動
日本語
日本語
English
小林 泰介
Latest
個々のリスクを持つマルチエージェント強化学習のための罰成形手法
個々の目的を持つマルチエージェントシステムのための平等性を考慮したデータ収集に基づくモデル学習
サンプリングベースモデル予測制御における棄却サンプリングの検証
個々の目的を持つマルチエージェント強化学習における多目的最適解の検証
制約付きNormalizing Flowと強化学習への応用
確率モデル学習のためのバイアス・バリアンスを調整する方策勾配型メタ最適化
バイアス・バリアンスのトレードオフを考慮可能な確率モデル学習
多変量分布を用いた報酬予測による利害関係を考慮したマルチエージェント強化学習
状況により変化する利害関係の推定に基づくマルチエージェント強化学習
エージェント間利害関係のオンライン分類による協調・競争タスクの学習
個々の目的を持つ自律分散型マルチエージェントにおける相関関係の学習
BibTeX
×