AIが数学試験を科学者よりも速く解き、ベンチマークが追いつかない現状
AIが数学の難問を驚異的な速さで解き、既存のベンチマークが陳腐化しつつあります。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
AIが数学の難問を驚異的な速さで解き、既存のベンチマークが陳腐化しつつあります。
OpenAIが、コード生成モデルの評価ベンチマーク「SWE-bench Verified」の使用を中止すると発表しました。
OpenAIが、数学の「First Proof」チャレンジにAIモデルの証明提出を行い、研究レベルの推論能力を披露しま…
ローカルAI推論ライブラリのGGMLとllama.cppがHugging Faceに合流しました。
Hugging FaceがUnslothとの提携により、AIモデルの無料学習サービスを提供開始しました。
Google DeepMindが、複雑なタスク向けに設計された新しいAIモデル「Gemini 3.1 Pro」を発表しました。
OpenAIがインド市場への本格参入を発表し、AIアクセス拡大を目指します。
GoogleのGeminiアプリが、テキストや画像から30秒の楽曲を生成できる新機能を搭載しました。
OpenAIのGPT-5.2がグルーオン振幅の新しい公式を提案し、学術協力者により証明・検証されました。
OpenAIがGPTを活用し、質的データを量的データに変換するオープンソースツール「GABRIEL」を公開しました。
Hugging FaceがCodexとClaudeを活用し、誰でもカスタムカーネルを生成できるツールを発表しました。
Google DeepMindが、科学・研究・工学分野の課題解決に特化した推論モード「Gemini 3 Deep Think」をアッ…