トープレッツMLPミキサー:低複雑度で情報豊富なシーケンスモデル
Transformerの注意機構をトープレッツ行列乗算に置き換えた新しいシーケンスモデル「TMM」が発表されまし…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
Transformerの注意機構をトープレッツ行列乗算に置き換えた新しいシーケンスモデル「TMM」が発表されまし…
主要なLLM(GPT、Gemini、Grok、Claude)が単一ファイルHTML生成の品質とソーシャルメディアでの拡散力を8…
視覚的テキスト圧縮(VTC)における情報損失を測度輸送の観点から定量化する新しい手法が提案されました。
ソフトウェア開発におけるエージェント型コーディングの進化と、その次の段階である「先見性」の重要性が…
OmicsLMは、トランスクリプトームデータと自然言語を統合し、生物学的推論を行うマルチモーダルLLMです。
入力適応型で無条件に直交する残差接続を持つ新しいTransformerアーキテクチャが開発されました。
連合学習環境で大規模言語モデルを効率的に適応させる新しい手法「GLoRA」が提案されました。
LLMベースの自律エージェントが、ハルシネーションなどの予測不能な失敗から自動的に回復するフレームワー…
GeoKANは、入力座標を学習された幾何学的に適応した座標に変換し、関数近似を行う新しいKANモデルです。
強化学習を用いたLLMの推論能力向上において、GXPOがGRPOより効率的に性能を改善しました。
強化学習において、Adam最適化アルゴリズムがストリーミング学習で効果的であることを発見しました。
VITA-QinYuは、ロールプレイングと歌唱の両方を生成できる初の表現豊かなエンドツーエンド音声言語モデル…