長文コンテキスト推論のためのCPU-GPU並列処理による効率的なハイブリッド疎行列アテンション
長文コンテキスト推論において、CPUとGPUを連携させ、効率的な疎行列アテンションを実現する新手法「Fluxi…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
長文コンテキスト推論において、CPUとGPUを連携させ、効率的な疎行列アテンションを実現する新手法「Fluxi…
ループ型LLMのメモリ消費を大幅に削減する新アーキテクチャ「MELT」が発表されました。
大規模言語モデル(LLM)が生成する幻覚が、科学論文の引用文献に大規模に浸透していることが判明しました…
生成モデルの再学習において、複数の報酬関数に基づく合成データの厳選がモデルの多様性崩壊を防ぐことが…
小規模言語モデルエージェントの推論能力を向上させる新しい蒸留フレームワーク「SOD」が開発されました。
イタリアのエンジニアリング社が開発したLLM「EngGPT2-16B-A3B」が、競合モデルと比較評価されました。
複数の損失項を持つモデルの事前学習において、勾配ベースの手法で損失の重みを効率的に調整する新技術が…
POETSは、計算効率の高いポリシーアンサンブルを用いて、不確実性を考慮したLLM最適化フレームワークです。
言語モデルの推論過程で生成される中間トークン列の不確実性を分析し、正解予測に活用する研究が発表され…
特権情報(PI)を統合することで、表形式基盤モデル(TFM)の学習を加速し、汎化性能を向上させるPIQLフレ…
AIモデルの長期的推論における学習効率と信頼性を向上させる「Prune-OPD」という新しいフレームワークが発…
LLMが自己評価する際に、従来の「信頼度」だけでなく、多次元的な評価指標が性能予測に有効であることが示…