スペクトルから思いもかけない物性をAIが予測

ad

2021-10-16 東京大学

〇発表のポイント:
◆X線や電子線を物質に照射し、得られたスペクトルから物性を調べる分光実験では、1つのスペクトルから取得できる物性情報は限られていると考えられており、目的の物性に応じて別の装置や条件で実験し直す必要があった。
◆今回、「内殻電子励起スペクトル」の解析に人工知能技術を利用したところ、このスペクトルと無関係と考えられてきた物性を含む11種類の物性情報を取得することに成功した。
◆従来の常識では想定できない物性情報を既存の分光実験から取得できる可能性を示しており、今後の物質開発の大幅な効率化や、新機能の発見への貢献が期待できる。

〇発表概要:
東京大学 生産技術研究所の溝口 照康 教授、東京大学 大学院工学系研究科 修士課程2年の菊正 翔 大学院生(研究当時)、東京工業大学 科学技術創成研究院の清原 慎 研究員、東京大学 生産技術研究所の柴田 基洋 助教らの研究グループは、人工知能技術を利用することで1つのスペクトル(注1)から多数の物性情報を得ることに成功しました。
物質開発の現場では、分光実験によりスペクトルを測定して物質の結晶構造や電子状態を調べます。分光実験に用いる装置や測定条件によって、得られたスペクトルから取得できる情報が異なります。たとえば、物質に電子線やX線を照射する内殻電子励起分光法(注2)で得られるスペクトルは、物質の局所的な電子構造の情報を主に有していることが広く知られています。それぞれの分光実験により得られる物性情報は、数種類程度でした。そのため、別の情報が必要な場合は、別の装置や条件で実験し直す必要がありました。
本研究グループは、このようなスペクトルの限界を打破すべく、人工知能で用いられる機械学習法の一種であるニューラルネットワーク(注3)を利用し、内殻電子励起スペクトルから得られる物性の情報を調べました(図1)。これまでのさまざまな分光実験の経験をもとに、容易に入手可能な3つの情報をニューラルネットワークの入力に追加した結果、1つの内殻電子励起スペクトルから、11種類の物性を高精度に抽出することに成功しました(図2)。得られた物性の中には、これまで本スペクトルから取得できることが知られていた電子状態に関する情報に加えて、本スペクトルとは無関係と考えられてきた光学特性、振動特性、さらに、分子の質量(分子量、注4)や、分子の安定性(内部エネルギー、注5)に関する情報も含まれていました。
本研究により、人工知能技術に人間のノウハウを組み合わせることで、これまでの常識とは異なる多数の情報をスペクトルから抽出できることが分かりました。1度の分光実験で多くの情報を得ることができれば、物質開発を効率的に行うことができると期待されます。
本研究成果は現地時間2021年10月15日(金)に独国人工知能誌「Advanced Intelligent Systems」オンライン版に掲載されました。

〇発表内容:
<研究背景>
物質開発の現場では分光実験によりスペクトルを測定して物質の結晶構造や電子状態を調べます。分光実験では、物質にどのような光を入射して、どのような光を検出するかで得られる情報が変わります。スペクトルが、物質と入射する光との相互作用によって得られるため、研究者はこれまで、個々の分光実験から得られる情報が限定されていると考えてきました。たとえば、電子線やX線を用いて測定する内殻電子励起分光法で測定されるスペクトルは、物質の局所的な電子構造の情報だけしか分からないと思われていました。そのため、多くの種類の情報を知りたい場合は、同一の試料を準備して、別の装置や実験条件で実験する必要がありました。
もし1つのスペクトルから多数の情報を得ることができれば、物質開発が効率的になることが期待されます。

<研究内容>
このようなスペクトルの限界を打破すべく、本研究グループは人工知能で用いられる機械学習法の一種であるニューラルネットワークを利用し、内殻電子励起スペクトルから得られる物性の情報を調べました。データベースに登録されている有機分子に対して、炭素から得られる内殻電子励起スペクトル(C-K edge)を約117,000個計算しました。そして計算スペクトルをニューラルネットワークの入力として、さまざまな分子物性(HOMO-LUMO gap(注6)、遷移エネルギー(注7)、内部エネルギー、分子量など、計12種類)の予測を試みました。本研究の模式図を図1に示します。
その結果、1つの内殻電子励起スペクトルから、予測精度が不足した1種類を除き、11種類の物性を高精度に抽出することに成功しました(図2)。得られた物性の中には、これまで知られていた電子状態に関する情報に加えて、スペクトルとの関係性が明らかになっていなかった光学特性、振動特性も含まれていました。さらに、分子の質量(分子量)や、分子の安定性(内部エネルギー)に関する情報も含まれていることが分かりました。
内殻電子励起スペクトルは電子励起に伴って得られるスペクトルで、物質の局所的な電子状態を反映するスペクトルであることが知られています。一方で、内部エネルギーや分子量は分子の大きさにも依存する示量性物性(注8)であり、内殻電子励起スペクトルとは完全に無関係と考えられてきました。実際に、本研究では示量性物性の決定をスペクトルだけで試みましたが一度失敗しています。その後、これまでのさまざまな分光実験の経験をもとに、容易に入手可能な3つの情報をニューラルネットワークの入力に追加しました。その結果、分子量などの示量性物性の決定に成功しました。
さらに、これまではブラックボックス化されてきたニューラルネットワークの中で、入力情報(スペクトル)と出力情報(物性)がどう紐づいているのかを可視化するために、学習済みのニューラルネットワークの解析に取り組みました。感度分析(注9)と呼ばれる手法を用いた結果、それぞれの物性が、スペクトル中の各ピーク位置や強度とどのように相関しているかが明らかになりました。同解析により、これまで全く明らかになってこなかった物性とスペクトルとの複雑な相関性も明らかになりました。

<今後の展開>
本研究により、人工知能技術を利用することで従来の常識では想定できない情報をスペクトルから取得できることが分かりました。さらに、人工知能技術に人間のノウハウを組み合わせることで、これまでの常識とは異なる情報の抽出が可能であることも分かりました。本研究の手法を利用し、1種類の分光実験で多くの情報を得ることができれば、物質開発を効率的に行うことができると期待されます。

〇発表雑誌:
雑誌名:「Advanced Intelligent Systems」(オンライン版:独国夏時間10月15日(金)掲載)
論文タイトル:Quantification of the properties of organic molecules using core-loss spectra as neural network descriptors(内殻電子励起スペクトルを記述子とした分子物性の定量)
著者:Kakeru Kikumasa, Shin Kiyohara, Kiyou Shibata, and Teruyasu Mizoguchi(菊正 翔、清原 慎、柴田 基洋、溝口 照康)
DOI番号:10.1002/aisy.202100103

〇発表者:
溝口 照康(東京大学 生産技術研究所 教授)
菊政 翔 (研究当時:東京大学 大学院工学系研究科 修士課程2年)
清原 慎 (東京工業大学 科学技術創成研究院 日本学術振興会特別研究員PD)
柴田 基洋(東京大学 生産技術研究所 助教)

〇問い合わせ先:
東京大学 生産技術研究所
教授 溝口 照康(みぞぐち てるやす)

〇用語解説:
(注1)スペクトル
物質の構造や機能を調べるために用いられる解析手法。赤外線、X線、電子線などさまざまな入射光が用いられる。入射光の照射に伴う吸収や発光などが検出され、本研究では、電子やX線を用いて測定される内殻電子励起スペクトルを対象とした。横軸にエネルギー、縦軸に吸収量をプロットして得られる2次元情報。

(注2)内殻電子励起分光法、内殻電子励起スペクトル
主に電子線やX線を用いて測定され、電子が励起した際に生じる吸収スペクトルを測定する手法および得られるスペクトル。物質の電子状態を調べるために使用されことが多い。

(注3)ニューラルネットワーク
脳を模した機械学習の手法で、入力データと出力データの間を多層のネットワークでつなぐ方法。本研究では、入力データがスペクトルで、出力データが物質の構造・機能となっている。教師あり学習によりネットワークのつなぎ方を変え、出力データの予測精度をあげることができる。

(注4)分子量
分子の質量に関する値。炭素原子を12とし、これを基準にして各原子の原子量を決める。分子量は原子量の総和。

(注5)内部エネルギー
分子の安定性を表す値。

(注6)HOMO-LUMO gap
分子の光学特性を表す物性。固体のバンドギャップに対応している。電子に占有されている軌道の中の最大エネルギー位置(最高占有軌道:HOMO)と、電子に占有されていない軌道の最小エネルギー位置(最低非占有軌道:LUMO)の差。

(注7)遷移エネルギー
スペクトルの中で最もエネルギーの小さなピークが立ち上がるエネルギー値。今回の研究では、遷移エネルギーの情報をあえて消して、スペクトルの形だけから遷移エネルギーを予測した。

(注8)示量性物性(示量性変数)
サイズに依存して変化する物性(変数)。たとえば重量や体積など。一方で、圧力や温度などサイズに依存しない物性(変数)を示強性物性(示強性変数)という。

(注9)感度分析
入力に用いるデータが、出力される値にどのように影響するのかを調べる方法。生産管理やトレーディングなどで利用されている。

添付資料:
図1溝口研.jpg
図1 本研究の模式図。順伝播型ニューラルネットワークの入力として炭素から得られた内殻電子励起スペクトル(C-K edge)を用いて、さまざまな分子物性の予測を試みた。

図2溝口研.jpg
図2 さまざまな物性の予測結果。左から、HOMO-LUMO gap、遷移エネルギー、内部エネルギー、分子量。縦軸と横軸はそれぞれ予測値と正解値。つまり、対角線上の線の近くに点が多いほど予測精度が高いことを表している。

ad

1701物理及び化学
ad
ad
Follow
ad
テック・アイ技術情報研究所
タイトルとURLをコピーしました