PlayStation4(PS4)用ゲームソフトGran Turismo (GT) Sportを用いて深層強化学習エージェントと人間のプロが対決.このゲームは実際のレースカーの非線形制御の課題を忠実に再現している.強化学習エージェントの学習にあたって、最先端のモデルフリーの深層強化学習アルゴリズムOR-SACの開発,スポーツマンシップを守りつつ競争力のある報酬関数の構築,更に学習シナリオにも工夫を加えたことで卓越したスピードと優れた戦術を組み合わせた統合制御方策を学習した.本論文のエージェント,Gran Turismo Sophy(GT Sophy)は世界最高のGTのドライバー4人と直接対決の末、勝利を飾った.