疎なオートエンコーダをVLMの敵対的攻撃検出用プラグアンドプレイファイアウォールとして活用
VLMに対する敵対的攻撃を検出する軽量なフレームワーク「SAEgis」が開発されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
VLMに対する敵対的攻撃を検出する軽量なフレームワーク「SAEgis」が開発されました。
AIエージェントが投稿・コメント・投票するReddit風プラットフォーム「Moltbook」のデータセットが公開さ…
物理シミュレーターを介入演算子として利用し、潜在的交絡因子が存在する環境で因果関係を発見する新手法…
LLM駆動の適応型内部脅威が、従来の検出システムを欺く「検出反転」を引き起こすことがシミュレーションで…
ロボットが分散された視覚-行動データから言語アノテーションなしで汎用的な視覚-言語-行動モデルを学習す…
大規模言語モデル(LLM)の出力に施された電子透かしが、意味を保ったまま除去可能であることが判明しまし…
LLMから特定の記憶内容を選択的に削除する、リテインセット不要な新しい忘却手法「SHRED」が開発されまし…
ニューラルネットワークが訓練データ外(OOD)のデータに対して汎化できない原因を特定する研究が発表され…
物理制約付き深層生成モデルの外挿性能を向上させる新しい手法が開発されました。
ハイパーリンク構造を活用し、RAGシステムの回答品質と効率を向上させる新戦略「LARAG」が発表されました。
自己解釈可能なグラフニューラルネットワーク(SI-GNN)の説明が自己矛盾を起こす原因を特定し、その解決…
人物画像アニメーションにおいて、高精度な手の動きを生成する新手法「IPA」が発表されました。