GazeVLM:マルチモーダル推論のための内部アテンション制御によるアクティブビジョン
GazeVLMは、人間のようなアクティブビジョンを模倣し、内部アテンション制御で視覚情報を処理する新しいマ…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
GazeVLMは、人間のようなアクティブビジョンを模倣し、内部アテンション制御で視覚情報を処理する新しいマ…
画像内のオブジェクト共起パターンを活用し、未知のデータ(OOD)をより正確に検出する新しいAIフレームワ…
LLMエージェントがサイバー攻撃において特定の手法に偏る「攻撃選択バイアス」が発見されました。
近似なしで勾配ベースの学習が可能な、微分可能な斜め決定木「DTSemNet」が開発されました。
PPI-Netは、タンパク質間相互作用ネットワークと経路レベルの表現を統合し、疾患を分子レベルから機能プロ…
敵対者が多数を占める分散型機械学習環境で、報酬と拒否のリスクを考慮した新しいアルゴリズム「VISTA」が…
MatryoshkaLoRAは、LLMのファインチューニングにおいて、効率と性能を両立させるための新しい低ランク適応…
フェデレーテッド学習環境で、VAE、GAN、拡散モデルを用いた予測保守の性能と通信コストを分析しました。
大規模言語モデルのオンポリシー蒸留(OPD)の学習を安定させる新しい手法「vOPD」が提案されました。
深層ニューラルネットワークの学習過程における隠れ層の重みスペクトルの進化を理論的に解析しました。
動画理解の報酬モデル開発を促進するため、新しいベンチマークと大規模なデータセットが発表されました。
AIのチャットボットへの集中が社会、経済、環境に与える構造的な欠点を指摘する論文が発表されました。