COVID-19インフォデミック:機械学習によるフェイクニュース検出におけるコンテンツ特徴の理解
COVID-19パンデミック中のフェイクニュース検出に、テキストおよび言語的特徴を用いた機械学習アプローチ…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
COVID-19パンデミック中のフェイクニュース検出に、テキストおよび言語的特徴を用いた機械学習アプローチ…
言語モデルのファインチューニングにおいて、メンバーシップ推論攻撃に強い新しいプライバシー保護手法「P…
AIの画像認識モデルがなぜ特定の予測をするのかを、人間が理解しやすい高レベルな概念で説明する新手法が…
ラベル付きベンチマークがない状況で、LLMの安全性を比較評価する手法が提案・検証されました。
信頼できないAIの展開プロトコルを評価する「AI制御ゲーム」という形式的な意思決定モデルが提案されまし…
差分プライバシーを保証する合成テキスト生成の統一評価フレームワーク「SynBench」が発表されました。
AIエージェントの安全性課題に対し、プログラミング言語ベースの「安全ハーネス」を提案しました。
自律エージェントの評価における既存の課題を解決するため、人間が検証した300のタスクを含む新しい評価ス…
AIの安全性、バイアス、法的問題を解決するため、オークションベースの新しい規制メカニズムが提案されま…
機械学習の積カーネルモデルに対し、厳密なShapley値を償却線形時間で計算する新アルゴリズム「PKeX-Shapl…
LLMの特定の振る舞いを司る内部回路を、帰属誘導型プルーニングで発見し修正する手法が開発されました。
ロールプレイングゲームとLLMを組み合わせ、デジタルシステムユーザーの道徳的プロファイルを要件定義で抽…