長尺動画理解のための適応的欲張りフレーム選択
長尺動画の質問応答において、入力フレーム数を最適化する新しいフレーム選択手法が提案されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
長尺動画の質問応答において、入力フレーム数を最適化する新しいフレーム選択手法が提案されました。
主要な大規模言語モデルが、誤った情報を生成する際に最も高い自信を示すことが判明しました。
大規模言語モデルの圧縮時に生じる誤差の伝播メカニズムを解明し、効率的な圧縮戦略を提案しました。
LLMの推論能力を向上させる「P^2O」という新しい学習手法が開発されました。
強化学習の観測データがマルコフ性を満たさない場合に、それを検出する新しいスコア「MVS」が提案されまし…
ニューラルネットワークの訓練における相転移現象が、パラメータ更新のグラム行列のスペクトルギャップに…
小規模なGPT-2モデルを使い、多言語環境での言語習得をシミュレートする研究が行われました。
新しい言語モデルアーキテクチャ「Multiscreen」が、従来のTransformerよりも効率的で安定した性能を示し…
StableTTAは、訓練不要なテスト時適応手法により、画像認識モデルの予測性能を向上させます。
MAT-Cellは、LLMとマルチエージェント推論を組み合わせ、単一細胞の自動アノテーション精度を向上させるフ…
拡散モデルのスペクトルバイアスを克服し、ゼロショット骨格動作認識の性能を向上させる新手法が発表され…
警察官のエスカレーション解除訓練を目的とした、実世界の警察と市民の対話データセット「DeEscalWild」が…