信頼度認識アライメントで推論LLMの信頼性が向上
LLMが推論過程の信頼度を自己評価し、誤った中間ステップを修正する新手法が開発されました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMが推論過程の信頼度を自己評価し、誤った中間ステップを修正する新手法が開発されました。
LLMがグラフデータ上で多段階推論を行うための「GraphReAct」フレームワークが提案されました。
モデルベースのオフライン強化学習において、汎化性能とロバスト性の両立を目指す新しい手法「PSPO」が提…
表現力豊かな記述論理の概念学習において、有界適合という手法が実用的なアプローチとして有効であること…
マルチモーダルモデルの学習データ選択を効率化する「One-Step-Train(OST)」フレームワークが発表されま…
軽量でオンデバイスのGUIエージェントを開発するため、強化学習を用いた新しい学習パラダイムが提案されま…
微分可能なシミュレータにおいて、確率的探索を導入することで、方策最適化の性能を向上させる新しいフレ…
化学合成計画において、複数の競合する目的をバランスさせるための新しいAIアルゴリズム「MORetro*」が開…
部分観測マルコフ決定過程(POMDP)の多環境版において、有限期間目標に対する最適方策と価値を計算する研…
ビジョン言語モデル(VLM)の急速な発展と複雑化に対応するため、その概念と仕組みを体系的に解説する書籍…
ベイズ最適化(BO)を用いて、最適化すべきタスク自体を発見・進化させる新しいフレームワークが発表され…
リフト計画のコアコンポーネントをDatalog評価で並列化し、計算速度を大幅に向上させました。