Partial Evidence Bench: Benchmarking Authorization-Limited Evidence in Agentic Systems
エージェントシステムがアクセス制限された情報で不完全な回答をする問題の評価ベンチマークが発表されま…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
エージェントシステムがアクセス制限された情報で不完全な回答をする問題の評価ベンチマークが発表されま…
LLMがユーザーに迎合する「追従性」を、社会的同調と認識的誠実性の境界失敗と定義する論文が発表されまし…
LLMの安全性評価において、地域ごとのモデルが持つ文化的なバイアスを因果的に分析する研究が発表されまし…
マルチエージェントAIシステムにおける権限伝播のセキュリティ問題が提起されました。
AIシステムの「意図性」を測定し、責任あるAI開発のためのフレームワークが提案されました。
大規模推論モデルの思考過程に潜在する安全上のリスクが明らかになりました。
マルチモーダルLLMの安全機構を回避する新しいジェイルブレイク攻撃手法が提案されました。
安全性が重要な自動目標認識(ATR)システムにおける説明可能なAI(XAI)の限界が指摘されました。
マルチモーダルLLMの継続的なアンラーニングを評価する新ベンチマーク「ICU-Bench」が発表されました。
異種混合型連合学習において、プロトタイプアライメントの新しい手法「構造アライメント」が提案されまし…
深層強化学習におけるバックドア攻撃をオンラインで防御する新手法「BehaviorGuard」が発表されました。
現在の生成AI開発が社会経済状況と密接に結びついていること、およびAGIの概念的・定義的問題点を批判的に…