ELAS:2:4アクティベーションスパース性による低ランク大規模言語モデルの効率的な事前学習
ELASは、2:4アクティベーションスパース性を活用し、LLMの事前学習効率を大幅に向上させる新しいフレーム…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
ELASは、2:4アクティベーションスパース性を活用し、LLMの事前学習効率を大幅に向上させる新しいフレーム…
グラフニューラルネットワーク(GNN)とセマンティックロスを組み合わせ、階層構造を考慮した知識グラフ埋…
LLMを活用し、スマートコントラクトの多様な脆弱性を高精度で自動検出するフレームワークが開発されました…
LLMのイベント因果関係識別における過剰予測(因果関係の幻覚)を抑制し、精度を向上させる新しいフレーム…
SAM-NERは、未知のドメインやスキーマで機能するゼロショット固有表現認識(ZS-NER)の新しいフレームワー…
ベイズ予測推論において、パラメータの不確実性を効率的に伝播させる新しい変分ベイズフレームワークが提…
LoRAファインチューニングにおいて、モデルの性能を維持しつつ必要なランクを大幅に削減できる条件が発見…
LLMが複数の制約を含む指示にどれだけ正確に従えるかを評価する新しいベンチマーク「MCJudgeBench」が発表…
物理的な愛着のあるオブジェクトにAIコンパニオンの機能を持たせる「Deco」というシステムが開発されまし…
LLMの活性化ステアリングが、プロンプトベースの手法に匹敵する性能を達成する新フレームワークが提案され…
言語モデルが哲学的概念の定義を反例を用いて反復的に分析・修正する能力を研究しました。
臨床LLMの安全性と精度が、モデル規模の拡大とは異なる法則で変化することが判明しました。