超難易度ゲームも、105時間の学習で世界トップに。
AI(人工知能)がまた人間を越えてしまいました。今回AIが取り組んだのは、ランナーを走らせるゲーム『QWOP』です。『QWOP』ではキーボードのQ・W・O・Pのキーをタイミングよく押すことでランナーが走っていく…はずなんですが、まず一歩進むだけでも一苦労、思うように動けないまま終了しがちで、短気な人はやらないほうがいいタイプのゲームです。でもWesley Liao氏が開発したAIは100メートル完走し、しかも人間の持つ最速記録をあっさり抜き去ってしまったんです。
Liao氏のAIは、大きく分けて2段階で開発されました。まず最初の段階はきちんと走ることそのものの学習で、「胴体が下がらない」「胴体の縦の動きを抑える」「ひざを曲げすぎない」といった動作を避けるようにプログラムされていました。開発過程では日本の『QWOP』プレイヤーのくろうど氏が協力していて、ベースのアルゴリズムはGoogle傘下のDeepMindが開発したACER、学習にかけた時間は合計で65時間でした。この段階でAIが出した最速記録は1分8秒で、Speedrun.comでの『QWOP』ランキングトップテンには入るものの、最速ではありませんでした。ちなみに一番速いのは日本のぐんまねこ氏の記録で、タイムは48.34秒でした。
そこでLiao氏は次のフェーズとして、とにかく速度をプラス評価するような学習方法を採用し、アルゴリズムもDeepMindのPrioritizedDDQNに変更しました。これにより新AIは、人間の最速記録を破る47.34秒をたたき出しました。学習にかかった時間は40時間、それと「プレトレーニング」が数分程度だけでした。ただ、Liao氏のAIは人間の記録を超えたんですが、残念ながらSpeedrun.comは人間だけを対象としていて、何かしらソフトウェアを使ったプレイ結果は載せてくれないそうです。
…ということはこれから、AIプレイヤー用のスピードランキングが必要かもしれません。AIの成長には警戒すべき部分もありますが、その進化ぶりは素直に興味深くもあります。QWOPはすごく難しいとはいえ、ゲームの構造は単純です。でもたとえば『ゼルダの伝説』シリーズみたいな、AIを使った他のキャラクターと対話しながら進むゲームをAIがどう解いていくかは興味深いです。もしかしたらLiao氏が作るようなAIは、人間のプレイヤーが気づきにくい近道やテクニック、ゲームプレイの戦略を発見してくれるかもしれません。でもQWOPプレイヤーのAIにも、参加賞くらいあげたいですね。
からの記事と詳細 ( またAIが人間に勝利 今度は100m走ゲーム『QWOP』 - GIZMODO JAPAN )
https://ift.tt/38s5spr
科学&テクノロジー
No comments:
Post a Comment