提携先のDroneiiがドローンとAIについての考察を発表した。「実用性の高いデータ」、これはおそらくドローン産業においてパワフルで有用なドローンの次に大きな原動力だ。ドローンは大量のデータを収集するものであり、それは我々の手に負えない量であることが多い。ドローンは、データを素早く解析でき、なおかつそのプロセスに余分な手間がかからない場合に限りユーザーにとって価値あるものになり得る。画像の解析が速ければ速いほど、正確であればあるほど、そして容易であればあるほど良いとされている。
- Advertisement -
ドローンとAIを組み合わせること、それが上述の課題をクリアする上での最適解と言えるかもしれない。今日、データ処理・解析・自律飛行コントロールに携わる企業の大半がAIやマシーンラーニング(ML)、ディープラーニング(DL)を活用しているという。しかし実際、これらの専門用語はどういう意味を持つのだろうか。それぞれどういった関係性を持ち、どこで用いられるのか。以下の文章はこれらの疑問への答えとなっている。
一般的にAIとは、人間の知能の性質を持つ複雑なタスクをこなす機械の性能のことを指し、タスクには、論理的思考、問題解決、計画、学習、人間の言語の理解と解析などが含まれる。(下の図表でこれらが確認できる)現在、AIとマシーンラーニング、AIとディープラーニング、AIとモーションプランニングの組み合わせはホットなトピックであり、本記事の主題にもなっている。
専門用語とその解説
■機械知覚
まず機械知覚とは何か。ドローンのこなすAI関連のタスクの多くは画像認識に関するもので、機体は何らかの手段で周囲の環境や物体を知覚する必要がある。この作業は大抵、エレクトロオプティカルシステムやステレオオプティカルシステム、LiDAR(光による検知と測距)などのセンサーを用いて行われる。このプロセスのことを機械知覚という。
- Advertisement -
■コンピュータビジョン(CV)
ドローンがセンサーを通じて未加工のデータを得ると、何らかの手段でそれを分析し、特定の用途に使われる意味ある情報を抽出する必要が生じる。それを実行する能力のことをコンピュータビジョンといい、/1枚もしくは複数枚の画像に含まれる有用な情報の自動的な抽出、分析、理解を行う。
■マシーンラーニング(ML)
識別可能なパラメーターを最大限活用するには、マシーンラーニングが有効だ。手動でプログラミングされ、特定の指示(コンピュータービジョンソフトウェア)でタスクをこなすソフトウェアとは異なり、マシーンラーニングのアルゴリズムは新たなデータに触れるたびに学習し、自己発達するようにデザインされている。
■ディープラーニング(DL)
その反面、ディープラーニングは情報処理に特化した学習手法であり、意思決定を行うためにニューラルネットワークやおびただしい量のデータを利用する、マシーンラーニングの部分集合だ。脳はニューロンネットワークで構成されており、それぞれの学習手法は人間の脳の機能をベースにしている。いわゆる人工のニューラルネットワークは複数の層に分かれており、それぞれが独自のタスクを担当している。
さらに、隣接する層は相互に繋がっている。このデザインのおかげで、すでに学習したコンテンツと新しいコンテンツの双方を結びつけることが可能となる。
マシーンラーニング(ML)やコンピュータビジョン(CV)よりもディープラーニング(DL)の方が重宝する場合とは?
多くの企業がCVから従来のMLを使ったアプローチへと移行する一方で、ドローン産業で多く見られる初期段階のアプローチはDLのアルゴリズムを利用したものだ。テクノロジー産業における近年の発展としてGPUs(グラフィックス プロセッシング ユニット)が挙げられる。
- Advertisement -
このプロセッサは、価格に見合ったパフォーマンスが可能なDLを実現し、重用されるハードウェアインフラとなった。ただし、GPUsのおかげで演算能力が劇的に向上したとはいえ、DLのアルゴリズムの事前学習にはまだかなりの時間がかかり、特定のタスクを確実にこなすレベルにするには何百万枚もの画像が必要となる。
結果、もし大量の画像データと十分な処理能力が用意できるのならば、DLは最良な選択と言えるかもしれない。従来のMLやCVよりも優秀であり、特に画像認識に関しては格段に優れている。
■モーションプランニング
次にモーションプランニング。状況認識に長けたツールで、広く言えば認識・回避テクノロジーや目視外飛行の分野で役に立つ。モーションプランニングの前提となるのは、周囲の環境の認識、つまり機械知覚だ。これを行うためにドローンはSLAM(自己位置推定と環境地図作成)テクノロジーを駆使して環境を視覚化する。
このテクノロジーによってドローンが得るのは、身の回りにある「何か」を認識する能力というよりも、その「何か」との距離を認識する能力だ。モーションプランニングの分野において、DLはドローンが人間や自転車、車といった対象を感知・認識し、その後最適な飛行ルートを確保できるようにするために使用されている。
AIは全ての問題の解決策になる得るか
まだそうとは言い切れないのが現状だ。高い性能を誇る様々な画像処理ソリューションが現役で活躍しており、特定のタスクに関して言えばMLやDLなどのアプローチと同レベルの優秀な働きを見せている。あるアプローチを採用した際にどういった結果が出て、どのような情報やデータが手に入るのかを予め考えて置く必要があるだろう。
MLを使ったアプローチには大量のデータと少なくない事前学習が必要だということも常に考慮しなければならない。
使用可能な画像数が少なければ、画像処理ソフトウェアの使用が最も賢明なソリューションとなるだろう。相当な量のデータが使用可能で、様々なタスクを処理しなければならない場合には、MLやDLを使ったアプローチの方が画像処理ソフトウェアよりも良い結果を出す可能性がある。
要するにタスクの量が多く、画像処理ソフトウェアでは対応が困難な時というのは、取り扱うデータのサイズが必然的に大きくなってくるので、MLやDLなどのアプローチが最も順当な解決策ということになる。
ML/DLアルゴリズムのアプリケーションの多くは点検やメンテナンスの分野で活用されている。Sky-FuturesやScopitoをはじめとする企業は、点検タスク用に複数のMLとDL(もしくは片方のみ)アプローチを駆使している。
例えば画像を元に送電線の絶縁体部分を自動で検出し、異常がないか確認するほか、アルゴリズムを用いて金属表面の腐食を検出するなどしている。Sky-Futureによると、検出率は80%~90%だという。
また別の例だが、アメリカのソフトウェア開発企業Ardennaは現在、鉄道会社BNSFのCVを使った線路点検からMLベースの線路点検へのアップグレードを試みている最中で、今後、一度に30箇所以上の損傷を発見できるようになるとしている。
AIを使用したアプローチの大多数が、エネルギー、農業、不動産、建築、林業の分野におけるデータ解析に貢献している。AIベースのデータ解析アプリケーションはすでに数えればきりがないほどの数に達しており、先ほど紹介した例は市場に出回っているもののほんの一部に過ぎない。
総括と今後の展望
上でも軽く触れた通り、ドローンとAIの最終目標は大量のデータ(例えば航空写真)の効率的な活用をできる限り自動化、シームレス化することだ。風力タービンの無地の白い画像を5000枚自らわざわざチェックして、細かい欠陥を探したい人などそうそういないだろう。
ドローンはデータの収集と分析をほぼ自動(もしくは全自動)で行えるようになってはじめてその真価を発揮する。可能な限り自動で大量のデータを処理できるポテンシャルを持っていると期待されているのがMLとDLを使ったアプローチだ。
加速度的に向上していく処理能力、近年のストレージコストの低下やデジタルデータの入手のしやすさにより、ドローンに複雑なAIアルゴリズムを組み込むことが容易になってきており、堅実なソリューションが市場に出回るようになった。
もしAIが近年の成長スピードをこのまま維持できれば、自動化された包括的なソリューションが利用可能になり、ドローンの価値をさらに押し上げていくだろう。ただし、企業が考慮しなければならないことが一つある。ドローンやAIが意味をなすのは、コストや時間の節約が見込める場合に限られる。
従来のCV(AL/DLとの組み合わせ)の方が手軽でベターなソリューションになり得るケースも依然としてあることは知っておくべきだろう。