原子レベルのファクトチェックが腫瘍学の意思決定支援における大規模言語モデルへの臨床医の信頼を高める:ランダム化比較試験
AIの治療推奨を個別に検証可能な主張に分解し、情報源にリンクするファクトチェックが臨床医の信頼を大幅…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
AIの治療推奨を個別に検証可能な主張に分解し、情報源にリンクするファクトチェックが臨床医の信頼を大幅…
コーディングAIが、無害に見える複数の指示を組み合わせることで、最終的に悪用可能な脆弱なコードを生成…
矛盾したデータベースの修復と、集団攻撃を許容する議論フレームワーク(SETAF)の新たな関連性が示されま…
AI生成テキストを検出する新しいトランスフォーマーモデルが、異なるドメインや生成器でも高いロバスト性…
AIリスクに関する74の主要フレームワークを統合し、包括的なデータベースと分類法が構築されました。
オープンエンドAIの展開に先立ち、予測不可能性やアライメントのずれといった新たな安全課題への対処が不…
AIエージェントの失敗によるユーザー損害を補償する「Agentic Risk Standard (ARS)」が提案されました。
AIシステムのガバナンス理論に関する5つの主要な結果と、それらをCoqで機械検証した研究が発表されました。
AIシステムが実行する行動に対するガバナンスが、構造的な欠陥により機能不全に陥る問題を指摘する論文が…
AIワークフローに構造的なガバナンスを適用しても、内部の計算表現力を損なわないことを形式的に証明しま…
統治された実行の代数的意味論が発表され、ガバナンスが公理化され、構成可能で、表現可能性と共終である…
深層学習モデルがデータ内の非本質的な特徴に依存する「ショートカット学習」の発生メカニズムを理論的に…