協調性が重要:協調型マルチエージェント強化学習の評価
協調型マルチエージェント強化学習の評価において、単なる結果だけでなく、エージェント間の協調メカニズ…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
協調型マルチエージェント強化学習の評価において、単なる結果だけでなく、エージェント間の協調メカニズ…
複数の感覚モダリティを統合するマルチエージェント強化学習フレームワーク「CRONA」が提案されました。
昆虫の脳構造に着想を得たモデルが、視覚的ポイントゴールナビゲーションで高い性能を示しました。
AIが行動モデルを、行動の観察なしに視覚情報のみから学習する新しいフレームワークが提案されました。
解析的勾配ベースの強化学習に、初の効果的な安全対策が開発されました。
ロボットの行動生成において、非同期フローマッチング(AFM)を導入したAsyncVLAが開発されました。
視覚言語行動(VLA)モデルが、ネットワークパラメータを増やさずに継続的にスキル知識を学習するフレーム…
ロボットの行動予測において、過去の自己受容感覚に基づき行動を生成する新しい手法が開発されました。
ヒューマノイドロボットが、視覚情報に基づき複雑な障害物コースでパルクールを自律的に実行しました。
個性を持つ自律型エージェント「PEPA」が、外部からの指示なしに目標を生成し、ロボットを自律的に行動さ…
オフポリシー強化学習において、批評家学習の過学習と不安定性を低ランク適応(LoRA)で解決する手法が提…
人間型ボールボットに強化学習による初の歩行ポリシーが実装され、シミュレーションから実機へのゼロショ…