Adam最適化におけるミニバッチノイズが暗黙的バイアスに与える影響
Adam最適化器のミニバッチノイズが、損失関数の鋭い領域と平坦な領域への暗黙的バイアスにどう影響するか…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
Adam最適化器のミニバッチノイズが、損失関数の鋭い領域と平坦な領域への暗黙的バイアスにどう影響するか…
分子構造と自然言語記述を対応させる大規模なデータセットが自動生成されました。
データ剪定手法「TopoPrune」が、潜在空間の摂動に強く、安定した性能を発揮します。
チェスの言語モデル「Mixture-of-Masters (MoM)」が、複数の世界クラスのグランドマスターのスタイルを模…
マルチモーダルAIにおける画像とテキスト表現の「モダリティギャップ」を解消する新しい学習手法が提案さ…
LLMの推論能力向上に用いられるRLVRにおいて、エントロピー崩壊を抑制する新しい制御メカニズムが提案され…
大規模言語モデル(LLM)のオフポリシー強化学習において、高い分散を抑え安定した学習を可能にする新手法…
機械学習や組合せ最適化における非凸関数の最適化を統一的に扱う新しいフレームワークが提案されました。
強化学習において、言語モデルの推論能力向上を目的とした新しいデータサンプリング戦略「Goldilocks」が…
スキーマ制約付きLLM生成のための大規模データセット「ScrapeGraphAI-100k」が公開されました。
LLMがマルチエージェント強化学習の新しいアルゴリズムを自動で発見しました。
LLMの倫理的選択が文脈によって大きく変化し、その隠れた構造が明らかになりました。