AGPO: Asymmetric Group Policy Optimization for Verifiable Reasoning and Search Ads Relevance at JD
JDがLLMの推論能力を向上させる新手法「AGPO」を発表しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
JDがLLMの推論能力を向上させる新手法「AGPO」を発表しました。
化学論文の分子構造図を機械可読形式に変換するOCSRの新たな評価ベンチマークが発表されました。
LLMの言語表現を広告の自動入札システムに組み込む新しいフレームワーク「SemBid」が提案されました。
LLMを活用し、学生の興味に基づいた個別最適化された大学課題を自動生成するプラットフォーム「Taklif.AI…
大気質予測モデルの現実的な評価を可能にするグローバルベンチマーク「AirQualityBench」が発表されました…
AIエージェントが協調してタスクを達成するための新しい通信フレームワーク「SANEmerg」が発表されました。
XDecomposerは、X線回折データから未知の複数物質を自動で分離・特定するAIフレームワークです。
インターネット・オブ・バリュー(IoV)における複合的なリスクを評価するAIエージェントのアーキテクチャ…
MLLMから特定の視覚情報を効率的に忘れさせる新しいアンラーニング手法が提案されました。
ユーザーの好みに合わせてレビューを要約するオンライン学習フレームワーク「PREFER」が提案されました。
DNA言語モデル「Wisteria」が、局所的特徴と広域的依存関係を統合した新しい学習フレームワークを提案しま…
AIを活用した数学的発見における人間とAIの協調的な作業フロー「インテントメイキング」が提唱されました。