Mage: コンパイル成功率を超えたLLM生成実行可能ゲームシーンの多軸評価
LLMが生成したゲームシーンの評価において、コンパイル成功率だけでは不十分であることを示す研究が発表さ…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMが生成したゲームシーンの評価において、コンパイル成功率だけでは不十分であることを示す研究が発表さ…
ビデオ言語モデルの推論コストを削減するため、動画の視覚トークンを効率的に圧縮する新手法「TTF」が提案…
長文LLMの推論コストを削減する新しいスパースアテンション手法「MISA」が開発されました。
RLベースのMLLM画像キャプションにおいて、複数の評価軸をバランス良く最適化する新しいフレームワーク「B…
複数LLMルーティングの「解決不能の天井」が、評価方法の偏りによって過大評価されていることが判明しまし…
教師モデルの出力のみで学生モデルを効率的に学習させる新しい手法「ROPD」が開発されました。
LLMを用いたソフトウェア工学コミュニティの心理的安全性に関する定性分析において、プロンプト戦略がLLM…
AIエージェントが投稿・コメント・投票するReddit風プラットフォーム「Moltbook」のデータセットが公開さ…
LLM駆動の適応型内部脅威が、従来の検出システムを欺く「検出反転」を引き起こすことがシミュレーションで…
LLMから特定の記憶内容を選択的に削除する、リテインセット不要な新しい忘却手法「SHRED」が開発されまし…
ニューラルネットワークが訓練データ外(OOD)のデータに対して汎化できない原因を特定する研究が発表され…
ハイパーリンク構造を活用し、RAGシステムの回答品質と効率を向上させる新戦略「LARAG」が発表されました。