誤較正の内生性:スコア報告における不可能性と回避策
AIエージェントの真実な報告を促すためのスコアリングルールにおいて、誤較正が内生的に発生する問題が指…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
AIエージェントの真実な報告を促すためのスコアリングルールにおいて、誤較正が内生的に発生する問題が指…
大規模言語モデル(LLM)が生成する幻覚が、科学論文の引用文献に大規模に浸透していることが判明しました…
敵対者が多数を占める分散型機械学習環境で、報酬と拒否のリスクを考慮した新しいアルゴリズム「VISTA」が…
AIのチャットボットへの集中が社会、経済、環境に与える構造的な欠点を指摘する論文が発表されました。
データ不足下での不確実性を扱う信念関数による統計的推論手法が調査されました。
おべっかを使うAIとの長期的な交流が、ユーザーの人間関係への認識に悪影響を与えることが研究で示されま…
個別差分プライバシー(IDP)におけるデータ有用性の不均衡問題を解決するINO-SGDアルゴリズムが提案され…
AIシステムの評価方法論における「リンゴとオレンジ」のような比較を解消するため、標準化された評価シナ…
AIの機械的解釈可能性研究が因果関係を主張する際に、必要な識別仮定を明示していないことが指摘されまし…
LLMエージェントが、異なる実験設定下で人間行動モデルと一貫した振る舞いをするか検証されました。
言語モデルが最終応答を生成する前に、潜在的な失敗を列挙・分析・制約する新しいフレームワーク「InvThin…
LLMの出力が安全要件を満たす確率を、決定論的に検証するフレームワーク「BEAVER」が発表されました。