重み空間演算によるゼロショット量子化
モデルの重み空間から抽出した「量子化ベクトル」を転送することで、訓練なしで量子化後の精度を大幅に向…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
モデルの重み空間から抽出した「量子化ベクトル」を転送することで、訓練なしで量子化後の精度を大幅に向…
深層学習の最適化を安定させる勾配正規化手法「Muon」の理論的基盤が構築されました。
Androidエージェントのオンライン強化学習において、単一状態から複数行動を学習する新フレームワーク「An…
AIコンポーネントベースシステムにおいて、新しいAI能力モジュールの安全な導入とロールバックを管理する…
長文LLMのKVキャッシュオフロードが、情報抽出量の多いタスクで性能劣化することが判明しました。
大規模言語モデルの効率的な後学習手法「Lightning OPD」が開発されました。
AIが自然な環境下でマルチモーダルデータからうつ病の重症度を推定する新手法が開発されました。
LLMを活用したアルゴリズム探索において、戦略空間を明示的に扱う新手法「SeaEvo」が提案されました。
過剰パラメータ化された深層学習ネットワークの最適化メカニズムにおいて、対称性が果たす役割が解明され…
手書きのルールなしに、ニューラルセルオートマトンが意味解析の構造的汎化を達成しました。
大規模視覚言語モデル(LVLM)の「視覚信号希釈」問題を解決する新モジュールが提案されました。
安静時fMRIデータに自己教師あり学習を適用する新しいフレームワーク「Rhamba」が開発されました。