A Regime Theory of Controller Class Selection for LLM Action Decisions
LLMが応答、情報検索、他モデルへの委譲、応答拒否のいずれを行うかを決定する「コントローラークラス選択…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMが応答、情報検索、他モデルへの委譲、応答拒否のいずれを行うかを決定する「コントローラークラス選択…
表形式基盤モデルの事前学習データとして、実データと合成データの分布を比較した研究が発表されました。
AIが研究者の漠然としたアイデアを具体的な研究課題へ導くフレームワーク「InciteResearch」が発表されま…
AIエージェントの作業を再現可能にするため、実行履歴をDAGで管理する新手法が提案されました。
Evidential Deep LearningにおけるOOD検出の評価指標「Vacuity」の課題が指摘されました。
AIエージェントが形式検証でSystemVerilog Assertionsを生成する際に、知識グラフが有効な手法として提案…
LLMが社会概念推論タスクにおいて人間専門家を上回り、評価飽和に達したことが示されました。
LLMエージェントの失敗を早期に警告する「PrefixGuard」という監視フレームワークが開発されました。
LLMベースの決済システムにおいて、タスク成功だけでなくワークフローの忠実性を測る新指標「ASR」が提案…
LLMの内部動作を解釈するため、活性化パッチングの結果をグラフ構造として分析する新手法が提案されました…
自然言語から時相論理式STLを生成するAIフレームワーク「ReasonSTL」が開発されました。
スパースオートエンコーダ(SAE)の機能をグラフ構造で分析する新しい手法が提案されました。