推論誘導型グラウンディング:マルチモーダル大規模言語モデルによるビデオ異常検知の向上
マルチモーダル大規模言語モデル(VLM)を活用し、ビデオ異常検知(VAD)において異常の分類、空間特定、…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
マルチモーダル大規模言語モデル(VLM)を活用し、ビデオ異常検知(VAD)において異常の分類、空間特定、…
良性データでのファインチューニングにより、AIガードモデルが安全性を完全に失う脆弱性が発見されました。
大規模なラベルなし心拍陣痛図データから、自己教師あり学習で生理学的に意味のある表現を学習する基盤モ…
VAEを用いた教師なし異常検知で、再構築品質と異常検出性能のトレードオフを緩和する手法が提案されました…
LLMの安全性を評価するため、進化的アルゴリズムを用いて多様な脱獄プロンプトを自動生成するフレームワー…
スパイクニューラルネットワーク(SNN)の、未知データに対する汎化性能の理論的限界が解明されました。
ヒンディー語の音声認識において、CNNを用いたキーワード検出システムが開発されました。
大規模AIモデルの学習を、一般ユーザーが分散型かつ持続可能な形で共同で行う新しい手法「DeRelayL」が提…
脳活動をデータ駆動型で普遍的な空間に表現する「Universal Brain Dynamics (UBD)」が開発されました。
Proteo-R1は、推論と生成を分離することで、新規タンパク質設計の精度と解釈性を向上させました。
PAMNetは、多変量時系列データの周期パターンを位相と振幅に分解し、高精度な予測を実現する新しいAIモデ…
動画コンテンツの論争性を検出する、学習不要のマルチエージェントAIフレームワーク「AuDisAgent」が開発…