エージェントにおける高品質な長期記憶コンテンツ生成のためのマルチメモリセグメントシステム
エージェントが過去の対話から高品質な長期記憶を生成する新しいシステムが開発されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
エージェントが過去の対話から高品質な長期記憶を生成する新しいシステムが開発されました。
LLMエージェントが、異なる実験設定下で人間行動モデルと一貫した振る舞いをするか検証されました。
視覚言語モデルの推論コスト削減のため、レイヤースキップの理論的条件を提案する研究が発表されました。
AIが患者の入院に関する質問に回答する際の品質を、自動評価で人間と同等に識別できることが示されました。
言語モデルが最終応答を生成する前に、潜在的な失敗を列挙・分析・制約する新しいフレームワーク「InvThin…
AIエージェントのワールドモデル学習を評価する新しいベンチマーク「WorldTest」が提案されました。
大規模推論モデルの訓練のため、推論とソルバーの能力に適応するデータ合成手法が開発されました。
LLMの出力が安全要件を満たす確率を、決定論的に検証するフレームワーク「BEAVER」が発表されました。
LLMを活用し、自然言語の指示からPDDLモデルを生成し、計画を策定するエンドツーエンドのフレームワークが…
モバイルGUIエージェントが、プログラム誘導型コンテキスト管理により、長期間にわたる複雑なタスクを効率…
LLMの科学的発見能力を評価する新しいベンチマーク「SDEフレームワーク」が発表されました。
大規模推論モデルの強化学習において、データ効率を大幅に向上させる新手法「Miner」が開発されました。