PRISM: Perception Reasoning Interleaved for Sequential Decision Making
LLMとVLMを連携させ、複雑なマルチモーダル環境でタスクを遂行するPRISMフレームワークが発表されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMとVLMを連携させ、複雑なマルチモーダル環境でタスクを遂行するPRISMフレームワークが発表されました。
強化学習のQ学習において、長期的な学習の安定性と精度を向上させる「Long-Horizon Q-learning (LQL)」が…
HaM-Worldは、選択的記憶とハミルトニアン構造を持つ新しい世界モデルを提案しました。
ソフトロボットが絡まりを回避する新しい強化学習制御フレームワークが提案されました。
ロボットが因果推論を用いて、本来の目的外の道具を創造的に活用する技術が発表されました。
目標条件付き強化学習と教師なしスキル学習を「制御最大化」という概念で統一する理論が発表されました。
ロボットの動きを正確に予測し、視覚的に生成する新しいワールドモデル「EA-WM」が開発されました。
ロボットが予測と現実の乖離を検知し、行動計画を適応的に調整する新しい手法が開発されました。
決定論的方策勾配(DPG)の学習安定性を向上させる新しい強化学習アルゴリズムが提案されました。
視覚言語ナビゲーション(VLN)において、ワンステップでグローバルな経路計画を行う新手法「NavOne」が発…
連続強化学習において、価値を保持する構造を自動で発見し、学習効率と安定性を向上させる新手法が提案さ…
協調型マルチエージェント強化学習の評価において、単なる結果だけでなく、エージェント間の協調メカニズ…