AIを鍛えるトレーニング
料理でも運転でも、何らかのスキルを向上させようとした場合、トレーニングを欠かすことはできない。特定の動作の繰り返しによって、重要なコツやテクニックを体に覚えこませることができる。そうしたコツは言語化が難しい場合が多く、実質的に、反復練習がスキル習得の唯一の手段となる。
- Advertisement -
いまAIを開発する手段として主流になっている「機械学習」も、簡単に言ってしまえば、同じことを機械に行わせるプロセスだ。「学習データ」あるいは「教師データ」と呼ばれる大量のトレーニング用データを与えて、そこから正解を出すモデルを自ら導き出すのである。得られたモデルはブラックボックス、つまりなぜ特定の答えが出たのかを説明できない状態になっていることが多く(それを回避するための手法も存在する)、その点も人間のトレーニングとよく似ている。
しかし人間と違い、機械は疲れを知らず、何度も繰り返しトレーニングを行うことができる。「テニスの壁打ち練習をしろ」と言われれば、何千回でも何万回でも、飽きずに繰り返してコツを習得できるのだ。たとえば次の動画は、Google傘下のAI企業DeepMind社が開発したAIが、昔懐かしいブロック崩しゲームをプレイする様子である。
動画の冒頭では、このゲームを100回プレイした状態のAIの様子が紹介される。いちおうゲームになっているとはいえ、まだぎこちなく、とても人間には敵いそうにない。しかし動画の中盤に登場する、ゲームを600回プレイしたAIは、ブロックの一部を崩してスクリーン最上面の隙間にボールを入れるという、人間のプレーヤーも行う戦術をマスターして高得点をたたき出している。
- Advertisement -
Googleの発表によれば、こうしてさまざまなビデオゲームをプレイさせた結果、中にはAIが人間のプレーヤーを上回るパフォーマンスを発揮するまでに至ったケースもあったとのことである。
ドローンの世界でも、同じようにドローン用AIをトレーニングして高度な操縦技術を習得させようという試みが進められており、実際に極めて優秀なドローンAIが登場している。しかし従来のケースでは、優秀な人間のパイロットの操縦をお手本とさせることが多く、用意できる学習データの量と質の点で限界があった。そこでスイスのチューリッヒ大学は、インテルと共同で、ドローンAIをトレーニングするユニークな手法を開発した。それはAIに仮想の「師匠」を与えるというものである。
仮想空間に現れる最強の「師匠」
ビデオゲームに登場する、いわゆる「ボスキャラ」は、全知全能とも呼べる能力を持っている場合がある。プレーヤーが知り得ないような情報、たとえば特定の場所に障害物や爆発物などが存在しているのを察知して、それをかわしたり、プレーヤーへの攻撃に利用したりといった具合だ。それはまったく驚くことではなく、ボスはゲーム環境と一体であり、単に全データへのアクセスを有しているに過ぎない。しかしそんな最強キャラが味方となって、プレーヤーを鍛えてくれるとしたらどうだろうか。
チューリッヒ大学の研究チームが行ったのは、まさにそれをドローンAIのトレーニングにおいて実施することだ。まず彼らは、AIのトレーニング用に、現実世界の木々を模した障害物の多い仮想空間を用意。そこに「師匠」として、仮想空間内の障害物の位置や、同じく仮想のドローンの飛行に関する情報(位置や速度など)に関する詳しいデータを与えられ、それに基づいて100点満点の飛行ができるAIを開発した。そしてトレーニングする対象である訓練生AIを招き入れて、師匠の操縦を学ばせたのである。
先ほどのブロック崩しAIと同様、訓練生AIはこの仮想空間の中で何百回というフライトを(師匠の操縦を参考にしつつ)繰り返した。そうしてトレーニングを終えたAIを、現実世界でのドローン操縦にチャレンジさせたところ、時速40キロメートルで障害物を回避することに成功した。これは従来の方法でトレーニングしたドローン操縦AIと比べ、およそ3倍にあたるパフォーマンスだったそうである。またこの手法を活用することで、AIがトレーニング時には経験しなかった、雪に覆われた地形や脱線した列車、倒壊した建物など複雑な環境に対応することも可能になるそうだ。
- Advertisement -
チューリッヒ大学の研究者らは、この新しいトレーニング方法が、他の条件下でのドローン操縦AIや、各種ロボットの開発においても活用できると期待している。たとえば豪雨や強風など悪天候下でのドローンの飛行や、交通量の激しい都市部における配送用自動運転車の走行といった具合だ。もちろん既にそうしたAIの開発は進められているが、師匠AIを活用するという手法によって、より優秀な判断を行うAIを短期間で完成させることが可能になるだろう。
将棋やチェスなど、AIが取り組むゲームの中には、人間には思いつかなかったような戦術を編み出すものも登場している。近い将来、師匠AIに教えを乞うのは訓練生AIだけでなく、人間も含まれるようになるかもしれない。