産官学共同によるAI研究開発、実証、社会実装を加速
2021-05-10 産業技術総合研究所
ポイント
- 2021年5月10日13時に「ABCI 2.0」の一般提供をスタート
- ピーク性能は単精度で226.0ペタフロップス、半精度で851.5ペタフロップスとなり、従来システムの1.5~3倍に
- 先進的なAI研究開発・応用実証や国内の大規模データ保有企業によるABCIの活用を加速
概要
国立研究開発法人 産業技術総合研究所【理事長 石村 和彦】(以下「産総研」という)情報・人間工学領域【領域長 関口 智嗣】は、2021年5月10日13時より大規模AIクラウド計算システム「ABCI 2.0」の一般提供をスタートしました。
従来システムである「AI橋渡しクラウド(AI Bridging Cloud Infrastructure、以下「ABCI」という)」は、わが国の人工知能技術開発の加速を目的として、産総研が設計・開発を行った計算システムで、産総研 柏センターのAIデータセンター棟に導入され、2018年8月に運用を開始しました。これまでに、ABCIを活用した国内企業が、深層学習における世界一の計算速度を達成したことを始め、多くの機関の利用により、顕著な成果を達成しています。また、特徴的な省電力運用への高い関心を寄せられてきました。一方で、運用開始から2年余りを経て、想定を超える高い需要のため、利用を開始できるまでの待ち時間が長いなどの課題がありました。また、大規模なデータ処理が必要となる先進的なAI研究開発・応用実証には、さらに高い計算能力が求められています。
これらの課題に対し、ABCI 2.0では、ABCIのGPUより高性能で省電力の最新GPUが960基搭載された計算サーバー、およびストレージシステムの増強を行いました。ABCI 2.0は、従来システムと一体で運用されます。この増強により、ピーク性能は、倍精度で56.6ペタフロップス、単精度で226.0ペタフロップス、半精度で851.5ペタフロップスとなり、従来システムに比べ、1.5~3倍のピーク性能となります。また、ストレージ容量は約1.5倍に、理論読み書き性能は約2倍となります。
ABCI 2.0の一般提供により、先進的なAI研究開発・応用実証や国内のデータ保有企業によるABCIの活用の加速が期待されます。
左:ABCIの外観、右:増設された計算サーバーの一部
経緯
産総研は、経済産業省「人工知能に関する橋渡しインフラ拡張」(令和元年度補正予算)の一環としてABCIの拡張システムである「AI橋渡しグリーンクラウド基盤(以下、「本拡張システム」という)」を整備しました。本拡張システムは、従来の資産を生かして ABCIと一体となるシステムとして、産総研情報・人間工学領域 人工知能研究センター、産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ、およびデジタルアーキテクチャ研究センターが設計・開発し、富士通株式会社の技術を採用しました。
本拡張システムは、2021年3月に導入され、従来システムと結合し、試験運用を経て、2021年5月10日13時より「ABCI 2.0」として一般提供を開始しました。
「ABCI 2.0」の特長
1) 最新の高性能・省電力GPUサーバー「計算ノード(A)」 120台
「計算ノード(A)」は、高性能で省電力の最新GPU「NVIDIA A100 SXM4」をサーバー1台あたり8基、計960基搭載します。これにより、ABCI 2.0のピーク性能は、倍精度で56.6ペタフロップス(19.3ペタフロップス増)、単精度で226.0ペタフロップス(151.0ペタフロップス増)、半精度で851.5ペタフロップス(300.8ペタフロップス増)となります。これは従来システムに比べ、1.5~3倍のピーク性能となります。
2) 従来システムとの一体運用を実現する大容量ストレージシステム
11.2ペタバイトの大容量ストレージシステムを追加し、すでに稼働している従来システムのストレージシステムとの相互アクセスを可能にすることで、ABCI 2.0としての一体運用を実現しました。この拡張により、従来システムに比べて、ストレージ容量は約1.5倍に、理論読み書き性能は約2倍に増強されます。これにより、従来ストレージの読み書き性能がボトルネックとなっていた大規模なデータ処理の性能向上が期待できます。
3) 世界トップクラスの省電力運用
サーバーと冷却システムの双方が世界トップクラスの省電力性能を持ちます。「計算ノード(A)」は、電力あたり性能が高い最新GPUを搭載しています。冷却システムは、従来システムと同様に、高温になるCPU、GPU、メモリなどの基幹部品をAIデータセンター棟が供給する外気に近い温度の冷却水により直接冷却し、残熱は同じ冷却水を用いた空冷システムにより除きます。このような工夫により、より少ない電力で高性能を発揮できます。
ABCI 2.0の計算資源の一覧は以下で公表されています。
ABCI計算資源: https://abci.ai/ja/about_abci/computing_resource.html
今後の予定
産総研は、ABCI 2.0を用いて、産学官や多様な事業者による利用の促進と高い計算能力を生かした人工知能技術の研究開発・実証の加速により、社会実装を推進します。産総研では、容易に構築できる人工知能技術の開発を目指して、汎用性の高い大規模な機械学習モデルの構築とその利用技術の開発を進めており、ABCI 2.0はこうした技術開発にも生かしていきます。また、ビッグデータ活用のためのシステム連携技術や大規模データ解析技術の研究開発を行うとともに、運用から課題を洗い出し、次世代ABCI構築技術をはじめとするデジタルアーキテクチャのコア技術の高度化を図ります。
また、産総研は、人工知能分野の最重要課題への挑戦を支援するため、ABCI 2.0の能力限界に挑戦する「ABCIグランドチャレンジ」プログラムを各年度3回実施しています(2021年度は6月、9月、12月に実施予定)。本プログラムでは、今回一般提供を開始した最新の高性能・省電力GPUサーバー120台(NVIDIA A100 SXM4 960基)を、無償で最大24時間、ひとつの研究グループで占有利用する機会を提供しています。日本国内のAI研究者の果敢な挑戦をお待ちしております。
本件問い合わせ先
国立研究開発法人 産業技術総合研究所
情報・人間工学領域 デジタルアーキテクチャ研究センター
総括研究主幹 小川 宏高
用語説明
- ◆倍精度、単精度、半精度
- 数値(実数)のコンピューター内での表現方法。倍精度は8バイト(有効桁数約16桁)、単精度は4バイト(有効桁数約7桁)、半精度は2バイト(有効桁数約3.3桁)で表現する。最新のGPUなどを用いると、半精度・単精度では倍精度よりも大幅に高速な演算処理が可能になるため、機械学習・AI分野において活用が進んでいる。
- ◆ペタフロップス(Peta FLOPS)
- フロップス(FLOPS, Floating-point Operation Per Second)は1秒間に行える浮動小数点演算の回数。ペタは(10の15乗)を意味する。
- ◆GPU(Graphics Processing Unit)
- 本来はコンピューターグラフィックス専用のプロセッサーだったが、グラフィックス処理が複雑化するにつれて性能や汎用(はんよう)性が増し、現在では高性能計算向けの汎用ベクトル・行列演算プロセッサーに進化している。深層学習(ディープラーニング)の高速化にも広く用いられている。
- ◆ABCIグランドチャレンジ
- ABCIを利用した人工知能分野の最重要課題への挑戦を促進するため、産総研が実施する公募型チャレンジプログラム。採択課題には、今回一般提供を開始する計算ノード(A)の最大120ノード(960GPU)、または計算ノード(V)の最大1088ノード(4352GPU)、最長24時間の利用権が与えられる。
ABCIグランドチャレンジ2021公募要領