「運転前に考える」:自動運転車のための世界モデルに触発されたマルチモーダルグラウンディング
自動運転車が自然言語の指示を解釈し、対象物を特定する新しいフレームワーク「ThinkDeeper」が開発されま…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
自動運転車が自然言語の指示を解釈し、対象物を特定する新しいフレームワーク「ThinkDeeper」が開発されま…
ATHENAは、科学計算と科学機械学習の全研究サイクルを管理する自律型エージェントフレームワークです。
LLMが人間が読める最適化戦略を用いて、コードの性能を向上させる新手法「PerfCoder」が開発されました。
高解像度画像における微細な劣化を評価するため、強化学習ベースの新しい画像品質評価フレームワーク「Q-P…
計算コストを抑えつつ、miRNAとmRNAの機能的標的関係を予測する新しいAIモデル「PAIR-Former」が開発され…
神経画像データから脳の潜在的な因果関係を直接的に発見する新しいAIモデル「INCAMA」が開発されました。
深層CNNのアーキテクチャトポロジーが画像認識性能と学習可能性にどう影響するかを研究しました。
VDCookは、自然言語クエリで動画データを生成・更新できる自己進化型プラットフォームです。
自動運転シーンの3D再構築において、LiDARの反射率情報を活用した新しい手法が開発されました。
動画推論モデルが、物体の動きの軌道を明示的に表現し、検証可能にする新手法「Motion-o」を提案しました。
鋼材表面欠陥分析に特化した、多形式のテキスト注釈を持つビジョン言語データセット「SteelDefectX」が発…
生物画像から形態学的特徴を自動で抽出し、アノテーションする新しいAIパイプラインが開発されました。