N
変分オプション発見アルゴリズム
OpenAIが強化学習における「オプション」を自動で発見する新しいアルゴリズムを発表しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
OpenAIが強化学習における「オプション」を自動で発見する新しいアルゴリズムを発表しました。
OpenAIが、モンテズマの復讐を単一の人間デモンストレーションから学習し、過去最高のスコアを達成しまし…
OpenAIがマルチエージェントシステムで方策表現を学習する新しい研究を発表しました。
OpenAIが学習エージェントの損失関数を進化させるメタ学習手法「Evolved Policy Gradients」を発表しまし…
OpenAIがロボット研究用に開発した8つのシミュレーション環境とHERの実装を公開しました。
OpenAIが複数の目標を同時に達成する強化学習の研究を呼びかけています。
OpenAIが階層的強化学習アルゴリズムを開発し、複雑なタスクを高速に解決可能にしました。
OpenAIがシミュレーションで訓練したロボットが、実環境の予期せぬ変化に対応できるようになった。
OpenAIがロボット制御をシミュレーションで学習させ、実世界で高精度に動作させる技術を開発しました。
OpenAIが画像入力からロボットを学習させる新しい手法「非対称アクタークリティック」を発表しました。
OpenAIがロボットの把持能力を向上させる新しいアプローチを発表しました。
シミュレートされたロボットレスリングにおいて、メタ学習エージェントがより強い非メタ学習エージェント…