時系列データの異常検知を行うAIモデルの自動作成技術を共同開発

ad

TDAを用いてAIモデルの作業工数を従来の100分の1に削減、現場適用を加速

2020-03-16    富士通株式会社,株式会社富士通研究所,Inria

富士通株式会社(注1)(以下、富士通)、株式会社富士通研究所(注2)(以下、富士通研究所)、フランスの国立研究機関Inria(注3)は、このたび、IoT機器などで取得される時系列データの異常検知を行うAIモデルを自動で作成する技術を開発しました。

近年、AI技術の発展により、様々なビジネス領域でAIの導入が進んでいます。AIモデルの作成現場では、AI専門エンジニアの人手により作成されることが一般的ですが、試行錯誤を繰り返しながら作り上げるため、多大な工数による現場への導入遅延が懸念されており、作業の自動化が求められています。

今回、Topological Data Analysis(注4)(以下、TDA)技術を用いた富士通研究所独自の時系列データ解析技術(注5)を活用することで、数多くの種類の情報が複雑に絡み合う時系列データの中から異常検知に必要な情報を自動で抽出し、異常検知を行うAIモデルを自動作成する技術を新たに開発しました。本技術の活用により、専門のエンジニアだけでなく一般のエンジニアでも容易にAIによる時系列データの異常検知モデルや分類モデルの作成が可能となるとともに、作業工数も従来の100分の1に削減できるため、様々なビジネス領域におけるAI適用の加速化が期待されます。

開発した技術は、Inriaが開発したTDAのOpen Source Software (以下、OSS)であるGUDHIに実装し、3月16日より無償で公開します。これにより、企業や研究機関などにおけるAI活用を促進するとともに、そのフィードバックを技術改良に継続して反映していくことで、様々なケースで使えるAIモデルの作成を実現します。

なお、本技術は、6月3日(水曜日)から5日(金曜日)までイタリアのパレルモで開催される機械学習の国際会議「AISTATS 2020 (The 23rd International Conference on Artificial Intelligence and Statistics)」にて発表します。

開発の背景

近年、AI技術の発展とともに、様々なビジネス領域へのAI導入のニーズが高まっています。AIの導入には、AIモデルを作成するため、データのどの部分を使用するかを決める特徴量の抽出や使用するアルゴリズムの選定、パラメーターのチューニング、作成したモデルの性能確認といった様々な作業が必要となります。これらの作業は、専門のエンジニアが目的を達成するまで試行錯誤を繰り返しながら人手で行なっているため、現場への速やかな導入を妨げる要因の一つになっています。

時系列データの異常検知を行うAIモデルの自動作成技術を共同開発
図1 新技術の導入前と導入後の作業イメージ

課題

現在、AIモデル作成の自動化に関する取り組みは様々な研究機関や企業で行われ、画像・テーブルデータに関しては、異常を検知するモデルの作成に使用する特徴の種類を比較的限定しやすく、解析手法も確立されているため、様々な研究機関や企業で自動化する技術が既に開発されています。一方で、例えばセンサーデータや心拍・脳波などの生体データを含む時系列データに関しては、取り出すデータの時間の長さを色々変えて特徴を取り出す必要があり、かつ、その特徴の種類も多様にあるため、適切な組み合わせを選択しないと目標とする性能を達成できず、AIモデルを自動作成することが困難でした。

開発した技術

今回、時系列データの異常検知に必要な情報を抽出し、異常検知モデルを自動で作成する技術を開発しました。

開発した技術の特長は以下のとおりです。

  1. 時系列データの特徴を抽出するアルゴリズムを共同開発富士通研究所が独自に開発した時系列データ解析技術を用いて、時系列データの異常検知に重要な特徴を抽出するアルゴリズムを富士通研究所とInriaが共同で開発しました。時系列データの中には、短区間に出る特徴と長区間を通して出る特徴があり、それらを適切に取り出す必要があります。また、区分したそれぞれのデータにも振幅や周波数といった特徴があり、統計的な解析手法や周波数解析手法では取り出すことのできない特徴も多くあります。本アルゴリズムでは、富士通研究所独自のAI技術である時系列データを高精度に分析するDeep Learning技術のもととなっているTDA技術により、区間の長さとその区間における波形状の挙動の特徴を軸とした平面に点としてマッピングすることができます。これにより、区間の長さや挙動の特徴などを俯瞰的に捉えることが可能になります。

    図2 時系列データが持つ様々な特徴を平面上にマッピング
    図2 時系列データが持つ様々な特徴を平面上にマッピング

     

  2. 特徴平面から異常検知に必要な情報を抽出(あらかじめ用意しておいた)時系列の学習データのそれぞれに対し、富士通研究所が独自に開発した時系列データ解析技術を用いて各時系列データの特徴をグラフの平面にマッピングします。それらのマッピングされた平面群を俯瞰し、正常データに共通して点が発生する領域や発生しない領域、共通の情報を持たない領域に平面を分割します。その際、各領域内の特徴点の数が同じになるように領域の数や分割の仕方を最適化し、その共通度合いの強さを共通度として計算し、共通度の強い順に領域を抽出します(図3)。図3 時系列の学習データを用いたAIモデルの作成
    図3 時系列の学習データを用いたAIモデルの作成

    次に未知の時系列データに対して、正常か否か判断するために、入力された未知の時系列データに対し、TDA技術を用いて抽出した特徴点をグラフの平面にマッピングし、マッピングした点が上記で分けられたそれぞれの領域に入る数を数えます。各点が入った領域の共通度を足し合わせた結果が、異常度合いを判定する閾値超えた場合に異常と判断します(図4)。

    図4 AIモデルを用いた未知の時系列データの予測
    図4 AIモデルを用いた未知の時系列データの予測

効果

今回、共同開発した異常検知モデルを自動で作成する技術を用いて以下の検証を行いました。

  • 橋梁の内部破損を検知するAIモデル試験用の模擬橋梁床版(注6)に取り付けた加速度センサーから、壊れるまでの30年分以上に相当する振動データをもとに検証したところ、AI専門のエンジニアが5日間かけて作成したAIモデルと同等の検出性能のモデルを10分で作成。
  • 人の脈波データから眠気などの異常状態を検出するAIモデルAI専門のエンジニアが標準的な手法を用いて4日間かけて作成したAIモデルと比べて平均誤差が10分の1以下のモデルを20分で作成。

本技術では、時系列データの特徴を平面にマッピングする際、特徴を詳細に切り分けているため、作成したAIモデルが想定外の結果を検出した場合でも、その情報を反映させて各領域の共通度を修正することができ、容易に目的に即したモデルへ修正することが可能です.

今後

本技術は、Inriaが開発したTDAのOSSであるGUDHIに実装させ、3月16日より無償で公開します。これにより富士通とInriaだけでなく、企業や研究機関などに向けて時系列データへのAI活用を促進し、そこで得られたフィードバックを基にGUDHIのOSSコミュニティと連携しながら技術改良を継続していきます。

また、富士通研究所は、今後、本技術を富士通のAI技術「FUJITSU Human Centric AI Zinrai(ジンライ)」に活用していきます。

商標について

記載されている製品名などの固有名詞は、各社の商標または登録商標です。

以上

注釈

注1 富士通株式会社:
本社 東京都港区、代表取締役社長 時田 隆仁。
注2 株式会社富士通研究所:
本社 神奈川県川崎市、代表取締役社長 原裕貴。
注3 Inria:
本社 ロカンクール ドメーヌ ド ヴォルソー、CEO: ブルーノ スポルティス
注4 Topological Data Analysis:
データをある空間内に配置された点の集合とみなし、その集合の幾何的な情報を抽出するデータ分析手法のこと。
注5 富士通研究所独自の時系列データ解析技術:
TDAを用いて、時系列データを高精度に分析する富士通研究所独自のDeep Learning技術。
「時系列データを高精度に分析する新たなDeep Learning技術を開発」(2016年2月16日プレスリリース)
注6 床版:
橋の上を通る車両の重みを橋桁や橋脚に伝えるための構造物である床板のこと。

本件に関するお問い合わせ

株式会社富士通研究所
人工知能研究所

Inria

1600情報工学一般1602ソフトウェア工学1603情報システム・データ工学
ad
ad
Follow
ad
タイトルとURLをコピーしました