有限期間目標を持つ多環境POMDP
部分観測マルコフ決定過程(POMDP)の多環境版において、有限期間目標に対する最適方策と価値を計算する研…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
部分観測マルコフ決定過程(POMDP)の多環境版において、有限期間目標に対する最適方策と価値を計算する研…
複数のロボットが協調して移動する経路探索問題において、学習可能な通信モジュールを導入し、効率的な情…
連続領域におけるオンライン目標認識の精度と効率を向上させる新しい手法が開発されました。
複数のエージェントが衝突せずに目標を達成する「ターゲット割り当てと経路探索(TAPF)」問題に対し、新…
視覚特徴ベースの世界モデル「RLA-WM」が、従来の画像生成モデルより高速かつ高精度な未来予測を実現しま…
ニューラルネットワークを用いたハミルトン・ヤコビ・ベルマン方程式の安定化ソルバーが開発されました。
潜在世界モデルの計画性能を向上させるため、予測精度と計画の乖離を補正する新しい補助目標「RC-aux」が…
VLAモデルのポリシー学習をシミュレーションで行う際、既存のワールドモデルの課題を解決する新手法「Swor…
生物学実験室の操作を自動化する、安価でプロトコル駆動型の視覚強化VLA対応マルチエージェントシステムが…
ロボットの認知エンジンとして大規模LLMをリアルタイムで活用する際の遅延を大幅に削減する新フレームワー…
ロボットが特定のタスクを学習する際、少ないデータで効率的に適応させる新手法が開発されました。
ロボットが分散された視覚-行動データから言語アノテーションなしで汎用的な視覚-言語-行動モデルを学習す…