XL-SafetyBench: A Country-Grounded Cross-Cultural Benchmark for LLM Safety and Cultural Sensitivity
LLMの安全性と文化的感受性を多言語・多文化で評価する新たなベンチマーク「XL-SafetyBench」が発表されま…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
LLMの安全性と文化的感受性を多言語・多文化で評価する新たなベンチマーク「XL-SafetyBench」が発表されま…
LLMのマルチタスク学習におけるタスク間干渉を低減する新手法「BADIT」が提案されました。
生成AIの危険性を発見するため、ペルソナを活用したレッドチーム手法「PersonaTeaming」が開発されました。
KANが時系列予測において、学習されたエッジ関数から忠実な説明を生成するフレームワークを提案しました。
LLMエージェントの推論効率を向上させる新しいキャッシュシステム「Irminsul」が発表されました。
Transformerモデルの計算コストを動的に制御する新しい手法が発表されました。
Apple Silicon上でint4 KVキャッシュがfp16より高速に動作する技術が発表されました。
プロアクティブなAIコーディングアシスタントの評価と訓練に関する実証研究が発表されました。
LLMベースのマルチエージェントシステムにおいて、アクティブラーニングで最適なコミュニケーション構造を…
LLMエージェントの安全性を高める階層型メモリ拡張ガードレール「SafeHarbor」が開発されました。
AIエージェントが自律的に研究を行い、効果的な機械学習の学習レシピを開発しました。
LLMの継続学習における壊滅的忘却を防ぐ新フレームワーク「CRAFT」が提案されました。