白内障手術動画分析のための大規模マルチソース・マルチタスクベンチマーク「Cataract-LMM」
白内障手術動画の深層学習分析に向け、大規模なマルチソース・マルチタスクベンチマークデータセット「Cat…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
白内障手術動画の深層学習分析に向け、大規模なマルチソース・マルチタスクベンチマークデータセット「Cat…
MLPの代替として注目されるKANsに関する包括的なレビューが公開されました。
ロボットの行動生成において、非同期フローマッチング(AFM)を導入したAsyncVLAが開発されました。
視覚言語行動(VLA)モデルが、ネットワークパラメータを増やさずに継続的にスキル知識を学習するフレーム…
AI生成動画の検出において、透かしが検出精度に与える影響を評価する新しいベンチマーク「RobustSora」が…
サッカーの多様な視覚理解タスクを統一的に処理するAIモデル「SoccerMaster」が発表されました。
LLMの医療応用における信頼性と安全性の課題を解決するため、新しい評価ベンチマーク「MediEval」が開発さ…
深層ベイズ強化学習(BRL)に一般化線形モデル(GLM)を導入し、タスク表現の曖昧さを解消しました。
多エージェントAIシステムにおける談合行為に対し、人間社会の防止メカニズムを適用する研究が発表されま…
AIモデルの精度と説明可能性を両立させるための新しいフレームワーク「IGBO」が提案されました。
参照画像とテキストで画像を検索する複合画像検索(CIR)において、表現空間の不整合を解決する新手法が提…
HERMESは、ストリーミング動画をリアルタイムかつ高精度に理解する、学習不要の新しいアーキテクチャです。