大規模言語モデル事前学習における有限サイズ勾配輸送:カスケードサイズから集中的輸送効率まで
大規模言語モデルの事前学習における勾配輸送を、5つの観測量に基づく有限サイズフレームワークで分析しま…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
大規模言語モデルの事前学習における勾配輸送を、5つの観測量に基づく有限サイズフレームワークで分析しま…
LLMの多言語における安全性アライメントの不均衡を、自己蒸留で改善する新手法が提案されました。
拡散ブリッジを用いたモダリティ変換において、ペアデータなしでも高品質な変換を実現する新しいフレーム…
ARISは、LLMを活用し、敵対的マルチエージェントコラボレーションを通じて自律的な研究を行うオープンソー…
Transformerモデルの推論を高速化する新しい手法「ゲート付き部分空間推論」が発表されました。
Transformerモデルのアテンション計算コストを削減する新しいトークン選択手法が提案されました。
自律型AIエージェントの行動を記述し、ゲーム理論に基づいて分析する新しいプログラミング言語「Pact」が…
材料科学・化学分野のLLMハッカソンで、科学研究に特化した多様なLLMアプリケーションが開発されました。
言語モデルの安全性ファインチューニングにおいて、モデル自身の有害な応答を基に難易度を評価し、最も難…
LLMエージェントを長期的な悪意ある脅威から守る防御フレームワーク「MAGE」が発表されました。
映画脚本の非線形な物語構造に対応し、核となるプロットを抽出して要約するAIフレームワーク「S^2tory」が…
強化学習において、大規模言語モデルの複雑な推論タスクへのアラインメントを改善する新しいフレームワー…