「ドコモ画像認識プラットフォーム」の機能を拡充

国内トップクラスの豊富なエンジンと支援機能で、幅広い課題を解決

国内トップクラスの豊富なエンジンと支援機能で、幅広い課題を解決

2021-02-24 株式会社NTTドコモ

株式会社NTTドコモ（以下、ドコモ）は、画像認識ソリューション開発が容易となる法人のお客さま向けのクラウドサービス「ドコモ画像認識プラットフォーム」（以下、本サービス）に、認識エンジンの種類、共通学習済みモデル、および複数の認識エンジンのAPI組み合わせ機能を追加し、2021年2月24日（水曜）から提供します。

本サービスは、画像認識を行うための「学習モデル作成」と「API」を提供するクラウドサービスです。ソリューション開発者は、AIエンジンの開発コストやサーバー運用コストを抑えて、用途に合わせた画像認識エンジンをクラウド上で簡単かつスピーディーに作成・利用することができます。また、「ドコモオープンイノベーションクラウド^®※1」上に構築しているため、「クラウドダイレクト」と併用することで、インターネットを通ることなく画像データを認識させることが可能で、低遅延、高セキュリティが要求される画像認識ソリューションにもご利用いただけます。

今回、本サービスに以下の3つの機能を拡充します。

認識エンジンの種類の追加
提供中の「物体検出」エンジンと「一般物体認識」エンジンに加え、新たに4つのエンジンを提供します。これにより、画像を扱う業務で必要とされる「検出」「分類」「OCR」「人物姿勢推定」「検索」を網羅し、クラウド上に管理機能を備えた画像認識サービスとしては国内でもトップクラス※2の豊富なエンジンを提供するプラットフォームとなり、従来以上に幅広い業種やニーズへの対応が可能となります。
- 「文字認識」エンジン：画像から文字を認識
- 「姿勢推定」エンジン：画像から人物の関節の状態を認識
- 「類似画像検索」エンジン：画像から認識した物体の形状や色・柄の特徴量から類似画像を検索
- 「特定物体認識」エンジン：画像から物体を照合し特定の商品などを認識
なお、これらはドコモが開発したAI技術である「画像認識技術※3」を活用したエンジンです。
共通学習済みモデルの提供
画像認識ソリューションでよく使われる物体や文字などについて学習済みのモデルをご用意します。お客さまによる画像データの収集や学習作業が不要になるため、作業負担を軽減し、お申込みからAPIのご利用開始までの期間を短縮できます。
API組み合わせ機能の提供
組み合わせて利用されることが多い複数のエンジンを1つのAPIに集約し、自動的に連携する機能を提供します。APIにアクセスするアプリケーション側で連携機能を作り込む必要がなくなり、スムーズに利用できるようになります。

なお、本プラットフォームは、研究開発部門・法人部門にて組織横断的にチームを構成し、お客さまと三位一体で課題解決を図る「トップガン^®※4」の取り組みにより創出したサービスです。

ドコモは、「ドコモ画像認識プラットフォーム」の利便性向上により、お客さまのニーズに合わせた経営課題・業務課題を解決する仕組みを提供し、新しい価値の創出や社会課題の解決に貢献してまいります。

※１．「ドコモオープンイノベーションクラウド」は、5G時代に求められる低遅延、高セキュリティなどMEC（Multi‐access Edge Computing）の特長を持つクラウドサービスです。（各種条件により遅延時間は変動するため、ネットワークの伝送遅延が必ず一定以下になるといった保証をするものではありません。）

※２．2021年2月24日現在、ドコモ調べ。

※３．ドコモの「画像認識技術」は画像に何が写っているかを認識・識別できるAIを実現するコア技術です。6つの画像認識エンジンの組み合わせからさまざまなソリューションを生み出すことが可能で、企業のニーズに合わせて経営課題・業務課題を解決するための仕組みを提供しています。ドコモの「画像認識技術」の一部は、NTTグループのAI「corevo^®」を構成する技術です。

※４．「トップガン」の詳細は、以下のホームページをご確認ください。
https://www.nttdocomo.co.jp/biz/special/topgun/

別紙　「ドコモ画像認識プラットフォーム」機能拡充の概要

1. 追加機能

（１）認識エンジンの種類の追加
新たに4つの認識エンジンを追加し、これまで以上に幅広い業種やニーズに対応できるようになります。

（２）共通学習済みモデルの提供
画像認識ソリューションでよく使われる物体や文字などについて学習済みのモデルをご用意します。
お客さまによる画像データの収集や学習作業が不要になるため、作業負担を軽減し、お申込みからAPIのご利用開始までの期間を短縮できます。

認識エンジン	共通学習済みモデル
「物体検出」エンジン	顔
「一般物体認識」エンジン	年齢性別感情推定／ファッション／食べ物／シーン／ランドマーク／花
「文字認識」エンジン	ゼッケン／活字／手書き
「姿勢推定」エンジン	人