計算シミュレーションとAIを連携させ、仮想実験環境を構築

材料ビッグデータの創出と、それを用いるAI材料設計へ

材料ビッグデータの創出と、それを用いるAI材料設計へ

2021-04-27 新エネルギー・産業技術総合開発機構,産業技術総合研究所

ポイント

計算シミュレーションとAIとの連携により材料設計に必要な大量データの創成技術を構築
材料ビッグデータに基づくデータ駆動型材料設計で材料開発期間の大幅な短縮に期待

概要

国立研究開発法人産業技術総合研究所【理事長石村和彦】（以下「産総研」という）機能材料コンピュテーショナルデザイン研究センター【研究センター長浅井美博】量子化学・分子シミュレーションチーム中村恒夫研究チーム長、Marius BUERKLE 主任研究員らは、国立研究開発法人新エネルギー・産業技術総合開発機構【理事長石塚博昭】（以下「NEDO」という）「超先端材料超高速開発基盤技術」プロジェクト【プロジェクトリーダー村山宣光（産総研副理事長）】にて開発された電気・光などのキャリア輸送を予測する第一原理計算シミュレーターとAI技術の連携により、実験データと同等の電気伝導度を計算する基盤技術を開発しました。この技術を用いた仮想実験を計算機上で実施することにより、材料の電気的な性質のデータを大量に生成し、それに対してAIを利用することにより、所望の電気的な性質を持つ材料を予測・設計する、いわゆる逆問題予測技術の構築につながることが期待されます。

本研究内容の詳細は、2021/4/27（米国東部夏時間）に、米国物理学会の学術誌「Physical Review Letters」の電子版に掲載されます。

計算とAIの連携による仮想実験の概念図

開発の社会的背景

材料開発期間の大幅な短縮が強く望まれる素材産業分野では、経験と勘のみに基づく材料開発を脱し、データを活用する材料設計に対する期待が高まっています。これを実現するためには、所望の機能・性質を実現する材料の組成と構造の情報、いわゆる逆問題の解を、人工知能（AI）技術を用いて予測する方法が有効です。AIを用いた逆問題予測には、材料の組成・構造と明瞭にひも付けられている機能・性質データの大量・広範な入力が必要ですが、材料分野ではそのような良質なデータが豊富とは言い難い状況にあり、良質なデータをどのようにして大量かつ広範に生成するかが大きな課題となっています。

研究の経緯

産総研では、計算シミュレーション、高速試作・革新プロセス技術や先端ナノ計測評価技術を活用する材料データのオンデマンド生成技術の開発に取り組み、また、それらを用いて得られる材料データとAI技術の利用によるデータ活用型材料設計技術を構築し、従来の材料開発と比べて試作回数・開発期間を大幅に短縮することを目標とする「超先端材料超高速開発基盤技術プロジェクト(2016～2021年度、以下「超超PJ」という）」に取り組んでいます。その中で、計算シミュレーションの適用を原子・分子レベルから部材レベルまでにつなげるマルチスケール化、材料機能の予測能力の強化と、それらによるデータの良質化に努め、計算シミュレーションデータを積極的に利用するデータ活用型材料設計技術の開発を推進してきました。しかし、計算シミュレーション手法の開発だけでは、計算シミュレーションを直接実施できる材料サイズの制約を克服することは困難です。材料の組成・構造と機能・性質データの間の明瞭なひも付けは、計算シミュレーションにとってはメリットですが、実験に完全にとって代わるデータ生成手法としては現実的ではなく、相互補完的な位置づけに留まっていました。

研究の内容

1）AIを用いた計算シミュレーションの順問題解決能力の高度化

超超PJでは、現実の実験結果と同等な材料データを生成するための技術開発を重視し、その中核に計算シミュレーションの利用を位置付け、AIを用いる計算シミュレーションの順問題解決能力の高度化研究を行なっています。今回開発した手法を図1に模式的にまとめました。まず、材料を構成する全原子の相対的位置情報を局所的情報に単純化します。これを記述子とすると同時に、さまざまな構造・組成に対する電気伝導度の第一原理計算シミュレーションを実施し、その結果のデータを深層学習法により学習します。記述子は構造の局所情報により構成しているので、それを構成要素として第一原理計算が直接適用できないような大きなサイズ領域の記述子を構築することができます。その記述子と電気伝導度を双方向に関連付けるよう学習により決められた層を多層化し、その配列をデザインします。その結果、第一原理計算では計算機性能の制約により直接適用できないような大きいサイズ領域における記述子を電気伝導度とひも付けることができ、電気伝導度を極めて高い精度で予測できることを検証しました。

※AIの学習のステップ（第一原理計算シミュレーションの実施と学習データ生成）を青色、学習済みAIによる予測のステップをオレンジ色で表示。
図1　第一原理計算シミュレーションと深層学習を連携させた材料機能推定手法の手順

2）検証結果（1）伝導度予測の精度

第一原理計算シミュレーション結果との比較による検証結果を図2に示しました。図2挿入の左図は、学習用に作成した第一原理計算による電気伝導度の計算結果値を横軸（真の数値）成分とし、学習済みの深層学習AIからの予測値を縦軸（予測）成分としてプロットした結果を示しています。予測値と計算結果値はよく一致しており、予測の精度を表す決定係数（R²）は極めて1に近い値をとり、学習用データに対して良い推定が行われていることを示します。学習に用いていないデータで検証を行った結果を図2挿入の右図に示しました。学習データよりも大きなサイズ領域での第一原理計算による電気伝導度の計算結果値を横軸（真の数値）成分とし、図1に説明した手順に沿って、小さなサイズ領域で学習済みの層から構成した深層学習を用いた予測値を縦軸（予測値）成分としました。予測値と計算結果値はこれもよく一致しており、決定係数は極めて1に近い値をとり、この場合も良い推定が行われていることを示します。このように、学習データ領域より大きなサイズ領域において、未知の組成・構造に対しても図1で説明した手順に沿った深層学習法は極めて良い推定結果を与えることが検証されました。

3）検証結果（2）破断接合実験（マクロスケール実験）

本技術が計算シミュレーションのサイズ制限を受けないことを検証しました。その結果を図2の本体に示します。検証対象の実験としては、金属ロッドに引張と圧縮を繰り返しながら同時に電気伝導度を計測解析する破断接合実験法を選びました。この実験法の特徴は、実験過程で非常に多くの構造が形成され、その全ての構造の電気伝導度を含む膨大な量のデータが得られることです。AIを用いる材料組成・構造情報の逆問題予測には広範な組成・構造に由来する膨大な機能物性データが必要であり、この実験法は、今回開発した計算・AI融合技術の能力を検証するには理想的な実験法です。破断接合過程を計算によりシミュレーションし、そこで得られた構造を入力データとして図1で説明した深層学習法によりその電気伝導度を推定し、ヒストグラムプロットを行った結果を図2に示しました。深層学習法によるヒストグラムは、実際の破断接合実験で得られているヒストグラムを非常に良く再現しており、第一原理計算と深層学習を融合した本技術は、計算機上で実験を完全に再現できる仮想実験技術として非常に高いレベルに到達しています。さらにこの技術には、実際の実験における、組成・構造と機能・性質間のひも付けの不明瞭さや、データの偏りや少量性といった問題が存在せず、逆問題予測に必要なデータの良質性を備えており、単なる仮想実験にとどまらないメリットがあります。

材料インフォマティクス分野において、計算シミュレーションとAI技術を連携させ、シミュレーションの加速に成功したこれまでの例は、ヨーロッパの有力材料インフォマティクス機関を中心に開発された、材料や分子を構成する原子の力場やエネルギーを予測する手法のみでした。今回の成果はそれに次ぐ第2例目であり、さらに電気伝導度のような物性の予測に関しては初の成果です。

※グラフに挿入の図は第一原理計算シミュレーション結果を用いた検定と検証を示した。決定係数（R²値）を数値で記載した。
左は学習データに対するテスト結果、右は検証データを用いたテスト結果
図2　学習済み深層学習により予測された破断接合のヒストグラムプロット

今後の予定

本開発方法をもとに、計算機上での仮想実験で、実際の実験や材料試作に応じた大量のデータを系統的かつ網羅的に生成し、このビッグデータを用いて電気伝導物性（材料機能）から材料組成・構造を予測する、逆問題予測手法の開発につなげていきます。

用語の説明

◆キャリア輸送: 材料は電気や熱、さらには光などを伝える媒体となります。媒体側から見て、それが伝える電気、熱、光などをキャリアと呼び、それが伝わる現象をキャリアの輸送またはキャリア輸送と呼びます。
◆第一原理計算: 計算対象を構成する各元素の種類と、計算対象の構造だけを入力パラメーターとし、調整パラメーターや実験結果を用いないで、シュレディンガー方程式などに基づく基礎方程式を数値的に解いて、計算対象の電子状態を求める方法を第一原理計算といいます。第一原理計算をもとに電気伝導度や電流を求める計算を、第一原理電気伝導計算と呼びます。
◆Physical Review Letters: 米国物理学会が刊行する物理学全分野の研究成果を掲載対象とする速報誌。最も審査が厳しいとされ、この分野の研究者に大きな影響を与える雑誌です。
◆記述子: 予測する物性についてのデータベースをもとに、その物性の予測モデルを構築するための説明変数。予測すべき材料は、記述子を用いて表現され、その物性は記述子を入力とする予測モデル（関数）の出力として予測されます。
◆深層学習法: AI技術の一つで、人の脳神経回路網をモデル化したもので、ニューラルネットワークの層を多層化し、各ニューロンの重みや活性関数、ニューラル間の結合を調整することで、入力データの特徴量の設定や、その組み合わせ、データの相関関係などを自動的に学習する方法です。

月	火	水	木	金	土	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30