創薬専用スパコンの開発 ~ 分子シミュレーション専用計算機「MDGRAPE-4A」~

ad
ad

2019-11-18 理化学研究所

理化学研究所(理研)生命機能科学研究センター計算分子設計研究チームの泰地真弘人チームリーダーらの研究チームは、分子動力学(MD)[1]シミュレーション専用計算機「MDGRAPE-4A[2]」の開発に成功しました。

本研究成果は、インシリコ創薬[3]の可能性を大きく拡げるものと期待できます。

MDシミュレーションは、水溶液中で変化し続けるタンパク質構造を解析するために、タンパク質を構成する原子や周囲の水分子に働く力を計算し、コンピュータ内でタンパク質を「動かす」手法です。大きなタンパク質の解析には、汎用スーパーコンピュータ[4](スパコン)でも膨大な時間がかかるため、分子シミュレーションを高速で行う専用スパコンの開発が待たれていました。

今回、研究チームは、自ら設計・開発した専用の大規模集積回路(LSI)[5]を512個搭載し、システム全体として約1.3ペタフロップス(1秒間に1,300兆回)の計算能力を持つMDGRAPE-4Aを開発しました。MDGRAPE-4Aは、タンパク質と水分子からなる10万原子系[6]のシミュレーションを、1日の計算で最高1.1マイクロ秒(1マイクロ秒は100万分の1秒)進める性能を持ちます。これにより、サブミリ秒(~100マイクロ秒)のタイムスケールで起きる水溶液中でのタンパク質と薬剤の分子間相互作用の解析が、現実的な時間で可能となります。

本開発は、東京都で開催された「情報計算化学生物学会2019年大会」(10月24日)で報告されました。また、完成品の一部を米国デンバーで開催される国際会議「Supercomputing SC19」(現地時刻11月18日~21日)で展示し、システム全体は理研大阪地区一般公開2019(11月23日)で公開します。

背景

細胞のさまざまな機能は、タンパク質などの分子が相互作用することにより制御されています。この仕組みを利用した分子標的薬[7]の開発では、がん細胞や病原体が持つ標的タンパク質に結合し、その機能を阻害する化合物を探索することが基本になります(図1)。しかし、生体内(溶液中)のタンパク質の構造は柔らかく、ゆらゆらと常に変化しています。このような構造変化は、X線結晶解析[8]など通常の構造解析の手法で解析することは困難です。そこで近年、スーパーコンピュータ(スパコン)を用いた分子シミュレーションにより標的タンパク質の構造変化を再現し、それに結合する化合物の候補を膨大な仮想化合物ライブラリーの中からスクリーニングする「インシリコ創薬」が注目されています。

分子標的薬がタンパク質に作用する仕組みの図

図1 分子標的薬がタンパク質に作用する仕組み

薬となる化合物(リガンド)は、体内で特定のタンパク質に強く結合することで、その機能を阻害するなどの効果を発揮する。

タンパク質の構造変化のシミュレーションでは、タンパク質を構成する数千個以上の原子間に働く力や、これらの原子とタンパク質を取り囲む数万個の水分子との間に働く力を、時間刻みで計算します。この計算結果から全ての原子の動きを求めることを繰り返すことで、タンパク質全体の動きをあたかも映画のコマを1コマ1コマ進めるようにシミュレーションします。これは分子動力学(MD)計算という手法で(図2)、膨大な時間がかかるのが特徴です。

生体分子の計算では、2フェムト秒(2×10-15秒)程度の動きを1コマとして計算します。生体内でのタンパク質の大規模な構造変化は、マイクロ秒(100万分の1秒)からミリ秒(1000分の1秒)、あるいはそれ以上のタイムスケールで起きると考えられており、例えば1コマ2.5フェムト秒(2.5×10-15秒)で10万原子系の100マイクロ秒間(1×10-4秒)の動きを再現するには、400億(4×1010)コマの計算が必要となります。現行の汎用スパコンでは1コマあたりの計算に最短でも約1ミリ秒(1×10-3秒)秒かかるため、400億コマの計算に必要な時間は最短で4000万秒(4×107秒、約1年3カ月)となります。

スパコンの性能が上がっても、1コマあたりの時間をミリ秒以下にすることは汎用計算を行う設計上困難であるため、分子シミュレーションを高速で行う専用スパコンの開発が待たれていました。

分子動力学(MD)計算を用いた高精度シミュレーションの例の図

図2 分子動力学(MD)計算を用いた高精度シミュレーションの例

図はMD計算で得られたタンパク質の高精度シミュレーションの例。リボンモデルで表した分子はタンパク質を、ボール&スティックモデルで表した分子はリガンドを示す。計算によって結合しやすさを求める際、実際にはタンパク質も薬の分子も形を変えるため、その変化をとらえることが重要である。MD計算では、タンパク質や薬となる分子、周囲の水分子を原子レベルでモデル化し、その時間発展を追う。

研究手法と成果

研究チームは、MD計算で必要な粒子間の力の計算に特化した加速装置を大型集積回路(LSI)に組み込み、このLSIを512個実装したMDシミュレーション専用スパコン「MDGRAPE-4A」を開発しました(図3)。MDGRAPE-4Aでは、タンパク質と水分子からなる10万原子系のシミュレーションを、1日の計算で最高1.1マイクロ秒間進める性能を持ちます。これにより、100マイクロ秒間の動きに必要な計算時間は91日間となり、汎用スパコンで最短でも1年3カ月かかっていたシミュレーションを約3カ月で完了することができます。

これまで理研が開発してきた専用計算機では、計算の一部のみを専用化し、残りは通常のコンピュータで計算していました。しかし、専用計算機が高速になるにつれ、この方式では通常のコンピュータの部分で性能が頭打ちになるようになってきました。そこで、MDGRAPE-4Aではこれまでの専用計算回路に加え、汎用計算部分やネットワークなど計算の全てを一つのLSIに統合した大規模な「システムオンチップ(SoC)[9]」とすることで、ボトルネックの解消を図っています。この実現には、多くの新しい技術開発が必要となりました。主要なものとしては、以下が挙げられます。

タイトルとURLをコピーしました