オープンウェイトLLMにおける評価コンテキストの乖離測定:アライメントパイプライン特有の異質性を示すペアプロンプトプロトコル
LLMが評価時と実運用時で異なる振る舞いをすることを示す研究が発表されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMが評価時と実運用時で異なる振る舞いをすることを示す研究が発表されました。
小規模言語モデル(SLM)を微調整することで、Windowsイベントログ分析において問題特定と解決策提示の両…
エッジデバイス上でカカオ病害をリアルタイムで検出する、軽量かつ高速なAIシステム「TinyBayes」が開発さ…
LLMを活用し、複数のサブ問題が密接に連携する「結合最適化問題」のヒューリスティックを自動生成する手法…
人間とAIが相互作用するシステムにおいて、AIへの過度な依存が知識の多様性を低下させる可能性が指摘され…
安価なLLMが低信頼度クエリを高価なLLMに委譲する「モデルカスケード」の費用対効果を意思決定理論で分析…
ニューラルネットワークの「グロッキング」現象を、トポロジーの観点から分析した研究が発表されました。
敵対的防御の評価において、メモリ効率を向上させつつ、より正確なフル勾配攻撃を可能にする新フレームワ…
新しい生成モデルフレームワーク「AuxPath-FM」が発表され、任意の分布から抽出された補助変数を確率パス…
AIモデルが未知のデータ(分布シフト)に遭遇した際の性能低下を改善する新しい学習フレームワーク「eX2L…
拡散モデルの高速化技術である分布マッチング蒸留を、連続時間最適化に拡張する新手法が発表されました。
MinMax代数に基づく新しいリカレントニューラルネットワーク(RNC)が提案されました。