パナソニックがAIモデルが学習していない物体の「知ったかぶり誤認識」を防ぐ技術を開発

2023.08.01

パナソニックホールディングス（以下パナソニックHD）とPanasonic R&D Company of Americaは、AIモデルが学習しておらず「本質的に認識ができない」物体を「未知物体」として認識するという、画像認識AIモデルの信頼性を高める技術を開発した。

本質的に認識が可能な学習済の物体のみを正しく認識

画像はイメージです。

画像認識AIモデルは事前に学習させた対象に対しては高い認識率を誇るが、実環境のすべての物体を画像認識AIモデルにあらかじめ学習させることは困難だ。そのため実際の利用環境では、AIモデルにとって未知の物体に直面することは避けられない。

一方、AIモデルは「知らない」と判断することが苦手だ。それゆえ、モデルが知っている範囲で無理やり認識して「知ったかぶる」ことが、予期しない誤動作にもつながりかねないことが近年AIの社会実装の進展に伴い、大きな課題となってきた。

そこでAIの信頼性を高める技術に注目が集まる中、画像認識結果が「どれくらい信頼できるのか（不確実性）」を推定可能な生成モデルを、画像認識モデルの後段に追加することで、「未知物体」に付与された誤ラベルを棄却。本質的に認識が可能な学習済の物体のみを正しく認識できるようにする技術FlowEneDetを開発した。

本手法は学習済の画像認識AIモデルの後段に追加するだけで簡単に拡張でき、高速に動作することが特徴だ。今後、AIの信頼性が求められる車載やくらし、B2Bなどの様々なユースケースでの活用が期待される。

本技術は、先進性が国際的に認められ、AI・機械学習技術のトップカンファレンスであるUAI2023（The Conference on Uncertainty in Artificial Intelligence）に採択された。2023年7月31日から2023年8月4日まで米国ピッツバーグで開かれる本会議で発表される。

開発された新技術の概要

画像認識AIのひとつであるセマンティックセグメンテーション（※1）モデルは、画像中の画素レベルで、ある領域が何の物体であるかを推定できる、モビリティ、製造、医療等の幅広い領域で欠かせないAI技術だ。

学習時と似た環境・物体については精度よく推定ができるが、前述したように実環境に存在するすべての物体を事前に学習させることは不可能。

学習データに存在しない未知の物体に遭遇した際、これも先ほど指摘したように、そのモデルが学習した物体ラベルを無理やり当てはめてしまうことが認識性能の低下や予期せぬ誤検知に繋がり、大きな課題となっている。

例えば、図1の矢印で示す物体（画像左上：ビールケース、画像左下：犬）は、セマンティックセグメンテーションモデルが事前に学習していない未知の物体だが、学習済のラベルから無理やり当てはめて推定してしまった結果、そもそも認識できない物体であるはずのビールケースを、一部が車（紺色）で残りが道路（紫）と誤認識し、同様に犬についても一部が木（緑）で一部が道路（紫）と誤認識してしまっている。

特に車載カメラに搭載されるAIモデルにおいては、「道路」と誤認識してしまうことは重大な事故にも繋がりかねず、未知物体は「未知」と推定できる技術が必要とされる。

図1　未知物体に誤ったラベルが無理やり振られてしまう例

これに対し、パナソニックHDとPanasonic R&D Company of Americaは、AIモデルが認識結果にどれくらい自信を持っているか（不確実性）を推定するフローベースの生成モデルFlowEneDetを開発した。

フローベースの生成モデルは、逆変換可能な関数の合成として複雑な分布を表現できるモデルだ。学習した物体の分布を正確にモデリングできるため、「学習した既知の物体」と「学習していない未知物体や誤分類（モデリング結果が実際の分布と合わない）」を分離することが可能となる。

さらに、未知物体（OOD）や誤分類（IDM）領域をより高精度に分離するため、データ密度のモデリングを行うエネルギーベースモデルと組み合わせた。

今回開発したFlowEneDetを通常のセマンティックセグメンテーションモデルの後段に追加することで、時間のかかるセグメンテーションモデル側の再トレーニングを行なうことなく、認識結果の不確実性を推定できるセグメンテーションモデルへと拡張が可能。

FlowEneDet自体は、エネルギーベースモデルにおける低次元の自由エネルギーを処理するモデルであるため、複雑さの低いアーキテクチャであり、学習・評価コストを大きく増やすことなく、未知物体と誤分類の同時検出を実現する（図2）。

図2　FlowEneDetを追加したセマンティックセグメンテーションモデル

事前トレーニング済みのセマンティックセグメンテーションモデルの後段に今回開発したFlowEneDetを追加し、複数のベンチマークデータセット（※2）に対して未知物体や誤分類の認識性能評価を行った結果、従来法を上回る認識結果（※3）を達成した（図3）。

図3　評価結果の一例（正解・従来法・本手法において、赤色は未知物体または誤分類、青色は既知物体、その他の色は未知か既知か判定できていない領域を表している）

今後の展望について

今回開発したFlowEneDetは、実環境でしばしばAIモデルが遭遇する、学習したことのない未知物体に対する誤認識を防ぐことで、モデルの性能と信頼性を高める技術だ。AIの信頼性が求められる車載やくらし、B2Bなどの様々なユースケースでの活用が期待される。

今回の発表についてパナソニックHDでは、「今後もパナソニックHDは、AIの社会実装を加速し、お客様のくらしやしごとの現場へのお役立ちに貢献するAI技術の研究・開発を推進してまいります」とコメントしている。

※1 セマンティックセグメンテーションとは、画素単位で物体の領域を認識し、各画素に何の物体が写っているのかを関連付ける画像認識タスク。セマンティックセグメンテーションのための代表的なAIモデルとしてDeepLabV3+やSegFormerが挙げられる（本手法の性能評価に利用）
※2 Cityscapes、Cityscapes-C、FishyScapes、SegmentMeIfYouCanのベンチマークデータセットにおいて
※3 MCD（Monte Carlo Dropout）、SML（Standardized Max Logits）といった従来法と比較し、真陽性率95%のときの誤検出率（FPR95）を20～50%低減

構成／清水眞希

パナソニックがAIモデルが学習していない物体の「知ったかぶり誤認識」を防ぐ技術を開発

本質的に認識が可能な学習済の物体のみを正しく認識

開発された新技術の概要

今後の展望について

@DIMEのSNSアカウントをフォローしよう！

最新号

人気のタグ

おすすめのサイト