N
方策勾配とソフトQ学習の等価性
OpenAIが方策勾配とソフトQ学習という強化学習の二つの主要なアルゴリズムが数学的に等価であることを発見…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
OpenAIが方策勾配とソフトQ学習という強化学習の二つの主要なアルゴリズムが数学的に等価であることを発見…
OpenAIが階層的強化学習に確率的ニューラルネットワークを導入しました。
OpenAIが教師なし学習でテキストの感情を高い精度で表現するシステムを開発しました。
シミュレーションで学習したAIが、物理ロボットでスパムを検出しました。
OpenAIが、進化戦略(ES)が従来の強化学習(RL)と同等の性能を発揮することを発見しました。
ロボットが一度のデモンストレーションから新しいタスクを学習する「ワンショット模倣学習」が開発されま…
OpenAIが機械学習の成果を伝える新しいジャーナル「Distill」の立ち上げを支援しました。
AIエージェントが独自の言語を開発するOpenAIの新しい研究が発表されました。
複数のAIエージェントが協力してタスクをこなす中で、独自の言語が自然発生しました。
OpenAIが時間セグメントモデル(TSM)を用いた予測と制御に関する研究を発表しました。
ロボットが人間のデモンストレーションを三人称視点から見て、タスクを学習する新しい手法が開発されまし…
機械学習モデルを誤動作させるよう意図的に設計された入力「敵対的サンプル」について解説。