画像認識AIモデルは事前に学習させた対象に対しては高い認識率を誇りるが、実環境のすべての物体を画像認識AIモデルにあらかじめ学習させることは困難である。そのため実際の利用環境では、AIモデルにとって未知の物体に直面することは避けられないという。
- Advertisement -
一方、AIモデルは「知らない」と判断することが苦手だ。モデルが知っている範囲で無理やり認識し「知ったかぶる」ことが、予期しない誤動作にもつながりかねないことが近年AIの社会実装の進展に伴い、大きな課題となっている。
AIの信頼性を高める技術に注目が集まる中、画像認識結果が「どれくらい信頼できるのか(不確実性)」を推定可能な生成モデルを、画像認識モデルの後段に追加することで、「未知物体」に付与された誤ラベルを棄却し、本質的に認識が可能な学習済の物体のみを正しく認識できるようにする技術FlowEneDetを開発した。
本手法は学習済の画像認識AIモデルの後段に追加するだけで簡単に拡張でき、高速に動作することが特徴です。今後、AIの信頼性が求められる車載やくらし、B2Bなどの様々なユースケースでの活用が期待されるという。
- Advertisement -
本技術は、先進性が国際的に認められ、AI・機械学習技術のトップカンファレンスであるUAI2023(The Conference on Uncertainty in Artificial Intelligence)に採択された。2023年7月31日から2023年8月4日まで米国ピッツバーグで開催される本会議で発表する。
技術の内容
画像認識AIのひとつであるセマンティックセグメンテーション※1モデルは、画像中の画素レベルで、ある領域が何の物体であるかを推定できる、モビリティ、製造、医療等の幅広い領域で欠かせないAI技術だ。
学習時と似た環境・物体については精度よく推定ができるが、実環境に存在するすべての物体を事前に学習させることは不可能だ。学習データに存在しない未知の物体に遭遇した際に、そのモデルが学習した物体ラベルを無理やり当てはめてしまうことが、認識性能の低下や予期せぬ誤検知に繋がることが、課題となっている。
※1 セマンティックセグメンテーションとは、画素単位で物体の領域を認識し、各画素に何の物体が写っているのかを関連付ける画像認識タスク。セマンティックセグメンテーションのための代表的なAIモデルとしてDeepLabV3+やSegFormerが挙げられる(本手法の性能評価に利用)
例えば、図1の矢印で示す物体(画像左上:ビールケース、画像左下:犬)は、セマンティックセグメンテーションモデルが事前に学習していない未知の物体だが、学習済のラベルから無理やり当てはめて推定してしまった結果、そもそも認識できない物体であるはずのビールケースを、一部が車(紺色)で残りが道路(紫)と誤認識し、同様に犬についても一部が木(緑)で一部が道路(紫)と誤認識している。特に車載カメラに搭載されるAIモデルにおいては、「道路」と誤認識してしまうことは重大な事故にも繋がりかねず、未知物体は「未知」と推定できる技術が必要とされる。
- Advertisement -
これに対し、パナソニックHDとPanasonic R&D Company of Americaは、AIモデルが認識結果にどれくらい自信を持っているか(不確実性)を推定するフローベースの生成モデルFlowEneDetを開発した。
フローベースの生成モデルは、逆変換可能な関数の合成として複雑な分布を表現できるモデルだ。学習した物体の分布を正確にモデリングできるため、「学習した既知の物体」と「学習していない未知物体や誤分類(モデリング結果が実際の分布と合わない)」を分離することが可能となる。さらに、未知物体(OOD)や誤分類(IDM)領域をより高精度に分離するため、データ密度のモデリングを行うエネルギーベースモデルと組み合わせた。
今回開発したFlowEneDetを通常のセマンティックセグメンテーションモデルの後段に追加することで、時間のかかるセグメンテーションモデル側の再トレーニングを行うことなく、認識結果の不確実性を推定できるセグメンテーションモデルへと拡張できる。
FlowEneDet自体は、エネルギーベースモデルにおける低次元の自由エネルギーを処理するモデルであるため、複雑さの低いアーキテクチャであり、学習・評価コストを大きく増やすことなく、未知物体と誤分類の同時検出を実現するという。(図2)
事前トレーニング済みのセマンティックセグメンテーションモデルの後段に今回開発したFlowEneDetを追加し、複数のベンチマークデータセット※2に対して未知物体や誤分類の認識性能評価を行った結果、従来法を上回る認識結果※3を達成した。(図3)
※2 Cityscapes、Cityscapes-C、FishyScapes、SegmentMeIfYouCanのベンチマークデータセットにおいて
※3 MCD(Monte Carlo Dropout)、SML(Standardized Max Logits)といった従来法と比較し、真陽性率95%のときの誤検出率(FPR95)を20~50%低減
今後の展望
今回開発したFlowEneDetは、実環境でしばしばAIモデルが遭遇する、学習したことのない未知物体に対する誤認識を防ぐことで、モデルの性能と信頼性を高める技術だ。AIの信頼性が求められる車載やくらし、B2Bなどの様々なユースケースでの活用が期待されているという。