More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models
推論モデルにおいて、思考の長さが長くなるほど選択肢の順序によるバイアスが増大することが判明しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
推論モデルにおいて、思考の長さが長くなるほど選択肢の順序によるバイアスが増大することが判明しました。
選挙区再編成の最適化問題を解決する新しいアルゴリズム「CM-Tabu」が発表されました。
再帰的推論システムの推論状態表現と停止条件に関する研究論文が発表されました。
マルチエージェントAIの内部表現から隠れた連合(コアリション)を検出する新しい手法が開発されました。
LLMがデプロイ後も経験から学習し続ける「デプロイ時学習」のフレームワークが発表されました。
LLMエージェントの記憶メカニズムの進化を「ストレージ」「リフレクション」「経験」の3段階で分類する調…
LLMが最終回答を生成する前に、いつ回答の意思決定が安定するかを分析する新しい理論が発表されました。
Weblicaは、視覚的なWebエージェントの訓練環境をスケーラブルかつ再現可能にするフレームワークです。
AIが物理学の推論を支援する際、批評と対話が成果にどう影響するかを研究しました。
LLMエージェントのセキュリティ監査を可能にする統一グラフ表現「Agent-BOM」が提案されました。
生成AIモデルの認知能力を人間と比較し、世代間の進化を評価する新しい心理測定フレームワークが提案され…
マルチエージェント強化学習において、エージェント間の協調にランダム性が必要な場合があることが示され…