新たな研究は、ドローンショー、倉庫ロボット、自動運転車の安全性を向上させる可能性を秘めている。
- Advertisement -
現在、ドローンショーは、ますます人気が高まっている大規模な光のディスプレイである。これらのショーでは、数百から数千の空中ボットが組み込まれており、それぞれが空中で複雑な形やパターンを形成するようにプログラムされている。
計画通りに進むと、ドローンショーは壮観なものとなる。しかし、最近フロリダ、ニューヨーク、その他の場所で発生したように、1機以上のドローンが故障した場合、地上の観客にとって深刻な危険となる可能性がある。
ドローンショーの事故は、エンジニアが「マルチエージェントシステム」と呼ぶもの、つまりロボット、ドローン、自動運転車などの複数の協調的、協力的、コンピュータープログラムされたエージェントのシステムにおける安全性を維持することの難しさを浮き彫りにしている。
- Advertisement -
今回、MITのエンジニアチームは、混雑した環境での安全な運用を保証できるマルチエージェントシステムのトレーニング方法を開発した。研究者たちは、この方法を使って少数のエージェントをトレーニングすると、それらのエージェントが学習した安全マージンと制御が、システム全体の安全性を確保する方法で、より多くのエージェントに自動的にスケールできることを発見した。
実際のデモンストレーションでは、チームは、飛行中に同時に位置を切り替えたり、地上の指定された移動車両に着陸したりするなど、さまざまな目的を安全に実行するために、少数の手のひらサイズのドローンをトレーニングした。
シミュレーションでは、研究者たちは、少数のドローンでトレーニングされた同じプログラムをコピーして数千機のドローンにスケールアップでき、大規模なエージェントシステムが同じタスクを安全に達成できることを示した。
MITの航空宇宙学准教授であるチューチュー・ファン氏は、次のようにコメントしている。
ファン氏:これは、倉庫ロボット、捜索救助ドローン、自動運転車など、エージェントのチームを必要とするあらゆるアプリケーションの標準となる可能性があります。これは、各エージェントがミッションを継続できるというシールドまたは安全フィルターを提供し、安全を確保する方法を伝えるものです。
- Advertisement -
ファン氏と同僚は、今月、IEEE Transactions on Robotics誌に掲載される研究で、新しい方法について報告している。この研究の共著者は、MITの大学院生であるソンユアン・チャン氏とオスウィン・ソー氏、および現在アリゾナ州立大学の助教授である元MITのポスドクであるクナル・ガーグ氏である。
ショッピングモールのマージン
エンジニアがマルチエージェントシステムで安全性を設計する場合、通常、システム内の他のすべてエージェントに対するすべての単一エージェントの潜在的な経路を考慮する必要があるという。このペアワイズ経路計画は、時間のかかる計算負荷の高いプロセスである。さらに、それでも安全は保証されない。
チャン氏:ドローンショーでは、各ドローンに特定の軌道(一連のウェイポイントと一連の時間)が与えられ、基本的に目を閉じて計画に従います。彼らは、どこにいる必要があるか、どの時間であるかしか知らないため、予期せぬことが発生した場合、どのように適応すればよいかわかりません。
MITチームは代わりに、システム内の任意のエージェント数に効率的にスケールできる方法で、少数のエージェントが安全に操縦できるようにトレーニングする方法を開発することを検討した。
また、個々のエージェントの特定の経路を計画するのではなく、この方法では、エージェントが安全マージン、つまり安全でない可能性のある境界を継続的にマッピングできるようにする。その後、エージェントは安全マージン内に留まっている限り、タスクを達成するために任意の数の経路を使用できる。
ある意味で、この方法は、人間が直感的に周囲を移動する方法に似ている、とチームは言う。
ソー氏:例えば、非常に混雑したショッピングモールにいるとします。安全に移動して誰にもぶつからないという点で、あなたのすぐ近くにいる人たち、例えばあなたの周りの5メートル以内にいる人たち以外の人のことは気にしないでしょう。私たちの研究も同様のローカルアプローチを取っています。
安全バリア
新しい研究で、チームは「グラフ制御バリア関数」を意味するGCBF+という方法を発表した。バリア関数は、ロボット工学で使用される数学用語で、一種の安全バリア、つまりエージェントが安全でない可能性が高い境界を計算する。特定のエージェントの場合、この安全ゾーンは、システム内で移動している他のエージェントの間を移動するにつれて、刻々と変化する可能性がある。
設計者がマルチエージェントシステム内の任意のエージェントのバリア関数を計算する場合、通常、システム内の他のすべてのエージェントとの潜在的な経路と相互作用を考慮する必要がある。
代わりに、MITチームの方法では、システム内のより多くのエージェントのダイナミクスを表現するのに十分に正確な方法で、ほんの一握りのエージェントの安全ゾーンを計算する。
ソー氏:そうすれば、すべてエージェントにこのバリア関数をコピーアンドペーストできるため、システム内の任意のエージェント数に対して機能する安全ゾーンのグラフが突然得られます。
エージェントのバリア関数を計算するために、チームの方法では、まずエージェントの「感知半径」、つまりエージェントのセンサー機能に応じて、エージェントがどの程度の範囲を観察できるかを考慮する。
ショッピングモールのアナロジーと同様に、研究者たちは、エージェントが安全を維持し、他のエージェントとの衝突を回避するという点で、感知半径内にいるエージェントのみを気にするものと仮定する。
次に、エージェントの特定のマシン機能と制限を捉えるコンピューターモデルを使用して、チームは「コントローラー」、つまりエージェントと少数の同様のエージェントがどのように移動すべきかの指示セットをシミュレートする。
次に、特定の軌道に沿って移動する複数のエージェントのシミュレーションを実行し、衝突が発生するかどうか、またはどのように相互作用するかを記録する。
チャン氏:これらの軌道が得られたら、現在のコントローラーでどれくらいの安全違反があるかなど、最小化したいルールを計算できます。次に、コントローラーをより安全になるように更新します。
このようにして、コントローラーを実際のエージェントにプログラムすることができ、それにより、エージェントはすぐ近くの環境で感知できる他のエージェントに基づいて安全ゾーンを継続的にマッピングし、その安全ゾーン内で移動してタスクを達成することができる。
ファン氏:私たちのコントローラーは反応型です。事前に経路を計画することはありません。私たちのコントローラーは、エージェントがどこに向かっているか、速度はどのくらいか、他のドローンがどれくらいの速さで移動しているかに関する情報を常に取得しています。このすべての情報を使用して、その場で計画を作成し、毎回再計画しています。したがって、状況が変化した場合でも、常に安全を維持するように適応できます。
チームは、8機のCrazyflie(軽量で手のひらサイズのクアッドロータードローン)のシステムでGCBF+を実証した。Crazyflieは、空中で飛行して位置を切り替えるタスクを与えられた。ドローンが最短経路をたどってそうしようとした場合、確実に衝突するだろう。
しかし、チームの方法でトレーニングした後、ドローンはリアルタイムで調整して互いを避け、それぞれの安全ゾーン内に留まり、その場で位置を正常に切り替えることができた。
同様に、チームはドローンに飛行して、特定のタートルボット(シェル状の天板を備えた車輪付きロボット)に着陸するタスクを与えた。タートルボットは大きな円を描いて継続的に走行し、Crazyflieは着陸中に互いに衝突することを回避できた。
ファン氏:私たちのフレームワークを使用すると、ドローンに衝突のない軌道全体ではなく、目的地を与えるだけでよく、ドローンは衝突せずに目的地に到着する方法を自分で見つけることができます。
ファン氏は、この方法が、ドローンショー、倉庫ロボット、自動運転車、ドローン配送システムなどの衝突回避システムを含む、その安全性を保証するために、あらゆるマルチエージェントシステムに適用できると見ている。
この研究は、米国国立科学財団、アクロバット飛行レジームにおける安全性(SAFR)プログラムに基づくMITリンカーン研究所、およびシンガポール国防科学技術庁によって一部支援された。