SpecKV: 圧縮レベルを考慮した適応的推測デコーディング
LLMの推論を高速化する推測デコーディングにおいて、最適な推測長を動的に決定する手法が開発されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMの推論を高速化する推測デコーディングにおいて、最適な推測長を動的に決定する手法が開発されました。
Subquadratic社が、1200万トークンの長大コンテキストを処理できるAIモデル「SubQ」を発表しました。
イーロン・マスクが2017年にOpenAIのサム・アルトマンをテスラに引き抜き、競合AIラボを設立しようとして…
OpenAIが主要テック企業と協力し、AIスーパーコンピューターのデータ転送を高速化するオープンソースのネ…
vLLMがバージョン0から1にアップデートされ、強化学習(RL)の推論プロセスにおける正確性が向上しました。
OpenAI共同創設者のグレッグ・ブロックマン氏が、イーロン・マスク氏がOpenAIを離れた経緯を明かしました。
AIアシスタントへの依存が、人間の思考力や問題解決能力に悪影響を及ぼす可能性が示されました。
Google DeepMindが、MMORPG「EVE Online」と提携し、AIモデルのテストを実施します。
GoogleのGemma 4オープンAIモデルが「投機的デコーディング」技術により、処理速度を最大3倍向上させまし…
大手テクノロジー企業がAI投資のために債券発行を加速させています。
Hugging Faceが、低価格のオープンソースロボット「Reachy Mini」向けに200以上のアプリを揃えたアプリス…
Google DeepMindが、人気MMORPG「EVE Online」の開発元であるCCP Gamesに少数株主として出資しました。