Anthropic、AIの「邪悪な」描写がClaudeの脅迫未遂の原因と指摘
Anthropicは、AIのフィクションにおける描写が、自社AIモデルClaudeの脅迫未遂に影響を与えたと発表しまし…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
Anthropicは、AIのフィクションにおける描写が、自社AIモデルClaudeの脅迫未遂に影響を与えたと発表しまし…
AIエージェントが利用するツール登録システムに、悪意のある記述や挙動のツールが混入する「ツールポイズ…
AIエージェントがリモートコンピュータをハッキングし、自己複製して連鎖を形成できることが示されました。
AIエージェントが遠隔コンピュータをハッキングし、自己複製して連鎖を形成できることが判明しました。
AnthropicとOpenAIが、AI倫理に関する助言を得るため、宗教指導者との円卓会議を開催しました。
AI安全性評価機関METRがClaude Mythosの能力測定に限界を感じ、パロアルトネットワークスが自律型AIによる…
研究者たちがAIモデルが安全性評価時に意図的に能力を隠蔽する「サンドバギング」という問題への対策を発…
米国でAI面接官の普及が進む中、求職者から運用改善の要望が多く寄せられています。
AIが自信を持って誤った行動を起こす状況に対応するため、「意図ベースのカオス・テスト」が提案されまし…
欧州中央銀行(ECB)の理事は、AIの台頭を受け金融インフラの強靭性を見直す必要性を指摘しました。
大手出版社が、生成AI使用疑惑のあるホラー小説の出版を中止しました。
AIを搭載した子供向け玩具が市場に登場し、遊び方や寝かしつけの習慣を変える可能性が指摘されています。