2021-09-17 理化学研究所,東北大学
理化学研究所(理研)放射光科学研究センター利用技術開拓研究部門生体機構研究グループの米倉功治グループディレクター(東北大学多元物質科学研究所 教授)、内藤久志先任研究員、浜口祐研究員、高場圭章特別研究員、XFEL研究開発部門ビームライン研究開発グループイメージング開発チームの眞木さおり研究員の研究チームは、人工知能(AI)制御によるクライオ電子顕微鏡(クライオEM)[1]の画像データの自動測定システムを開発しました。
試料の結晶作製が必要ない「単粒子解析[2]」では、個々の分子が写った多数の画像を撮影すること、微小結晶を用いる「電子線三次元結晶構造解析[3]」では、回折パターン[4]を記録することで、タンパク質などの立体構造を決定します。後者は薬剤や機能性材料の詳細な構造決定にも用いられています。どちらの手法も半自動で測定できるものの、データ取得に失敗する場合もあり、解決すべき課題として残されていました。
今回、研究チームは、AIを利用してクライオEMのデータ測定を制御するソフトウェア「yoneoLocr」を開発しました。まず、分子の画像撮影と電子回折パターン測定に必要となる画像データを、ディープラーニング[5]で機械学習させました。次に、学習結果をデータ測定時にリアルタイムで利用できる一連のシステムを開発し、理研の高性能クライオEMで運用しました。その結果、両手法において、データ取得の失敗は大幅に減少し、完全自動での測定が可能になりました。
本研究は、本研究は、オンライン科学雑誌『Communications Biology』(9月7日付)に掲載されました。
開発したAIソフトウェア「yoneoLocr」によるクライオEMのデータ測定制御の概略
背景
クライオ電子顕微鏡(クライオEM)の「単粒子解析」では、試料の結晶作製を必要とせず、個々の分子が写った多数の画像を撮影することで、タンパク質などの立体構造を決定します。具体的には、カーボン膜に規則的に並んだ直径1~2マイクロメートル(μm、1μmは1,000分の1mm)の多数の穴(図1)の中の薄い氷に、試料のタンパク質を包埋し、液体窒素(-196℃)冷却下で観察します。このとき、構造解析に用いる高い倍率(5万~10万倍)で観察しながら、撮影位置を試料の場所に合わせると、強い電子線の影響でタンパク質は破壊されてしまいます。
そこで、中程度の倍率(1,000~1万倍)で撮影した像を用いて、電子顕微鏡の試料ステージの位置を調整します。この位置合わせには、事前に用意した参照像との相関(どのくらい似ているかを数値で評価する)を計算するのが一般的な手順です。しかし、氷が厚く像のコントラストが悪かったり、氷の塊やカーボン膜の切れ端などの大きなゴミ(コンタミネーション)が写り込んだりすると、参照像との相関が悪くなり、位置合わせが正しくできず、撮影は失敗してしまいます。
一方、「電子線三次元結晶構造解析」では、薬剤や機能性材料などの分子の非常に微小な結晶から、原子の配置を詳細に決定できます注1)。この手法では、クライオEMを用いて試料の結晶の回折パターンを多数測定しますが、単粒子解析と同様に位置合わせの問題が生じます。加えて、事前に回折パターンを得られる結晶であるか否かが判別できず、測定に適した結晶を探すのに半日以上要する場合もあるというのが課題でした。
そこで研究チームは、クライオEMを用いた測定の制御に人工知能(AI)の活用を試みました。
注1)2015年2月23日プレスリリース「微小で薄いタンパク質結晶の電子線構造解析」
研究手法と成果
研究チームは、ディープラーニングを用いたリアルタイムでの画像検知に定評のある、YOLO(You Only Look Once)というオープンソース[6]ソフトウェアを利用しました。
まず、単粒子解析では、実際の撮影時に集められたカーボン膜の穴の多数の写真から、その特徴をYOLOにディープラーニングで機械学習させました。そして、この学習データで検知された膜穴の場所から、電子顕微鏡の試料ステージ位置を調整するシステムを開発しました。
最新の撮影技術では、一度ステージの位置を合わせると、その周囲3×3や5×5の複数の膜穴から、電子ビームを偏向させることで画像データを取得します(図1)。こうすることで、安定性が悪く、動きの遅いステージでの機械的な移動を最小限に抑え、良質な画像データを高速に取得できます。ただし、はじめのステージ位置の調整に失敗すると、図1の例では25枚、場合によっては100枚以上の失敗した画像データが貯まってしまいます。
図1 単粒子解析で用いる凍結試料とカーボン膜の穴の並びの模式図
左:1000倍程度の倍率で撮影したクライオ電子顕微鏡像。カーボン膜の穴に張ったアモルファスな氷の中にタンパク質分子が埋まっている。
右:1回の試料ステージ移動で撮影するカーボンの膜穴の模式図。黄色の中央の位置に試料ステージを合わせた後、ビームの偏向により周囲5×5の穴から撮影する。
開発したシステムを使うことで、撮影の失敗はなくなりました。穴の検出にかかる時間は0.1秒以下になり、視認性の悪い場合でも、正確に試料ステージの位置合わせができるようになりました(図2)。これにより、理研の高性能クライオEM注2)において、高分解能[7]かつ高精度でのタンパク質の単粒子解析が、さらに高効率で実現しました。
図2 yoneoLocrによるカーボン膜の穴の検出
四角で囲んだのがyoneoLocrで検出したカーボン膜の穴。従来、ゴミ(左図左上の塊)に加えごく一部しか膜の穴が写っていないとき(左図)や、穴が非常に視認しにくいとき(右図)は、相関での位置合わせに失敗していた。しかし、今回開発した手法では正確に穴が検出できるようになった。四角の上の数字は、検出の信頼度を示す。
次に、電子線三次元結晶構造解析のために、タンパク質、ペプチド、機能性有機材料、薬剤などのさまざまな試料の微小結晶の低倍率の像を機械学習させました。クライオEMの観察でコンタミネーションとしてよく見られる氷の結晶なども同定し、撮影から除外できるようにしました。さらに、これらの試料の回折パターン(図3左と中央)も同様に学習させ、学習結果を電子顕微鏡の制御ソフトに組み込みました。その結果、試料位置を外すことがなくなったと同時に、回転測定の前に結晶の品質を判定できるようになりました。また、低倍率(数百倍)の像から結晶位置を決定できるように学習させ、その場所を撮影候補のリストに登録できるようにもしました(図3右)。
これにより、電子回折の三次元データ測定においても、ほぼ全自動で高品質なデータ取得が可能になりました。この開発も理研の高性能クライオEMにおいて運用し、高精度かつ高効率な微小結晶構造解析が実現しました。
図3 自動測定システムyoneoLocrの電子回折測定への応用
左:タンパク質の微小結晶の回折パターンの例。回折点がきれいに出ており、高い信頼度で”good”と評価されている。
中央:機能性分子の微小結晶の回折パターンの例。このパターンは回折点の品質が悪く”bad”と評価されている。
右:低倍率の像からの微小結晶の検出。厚くて測定に適さないもの(”thick”として検知)などは自動で測定から除外できる。
研究チームは、今回開発したシステムを「yoneoLocr(You Only Navigate Em Once to LOCate in Real time)」と名付け、自動撮影および関連スクリプトプログラム、手順とともにソースコードを公開しました注3)。
注2)2019年5月21日プレスリリース「タンパク質やその複合体の高分解能・高精度解析に成功」
注3)GitHub – YonekuraLab/yoneoLocr: Real-time object locator / evaluator for cryo-EM data collection
今後の期待
本研究では、ディープラーニングを利用して、クライオEMの単粒子解析と微小結晶からの電子回折データの自動測定を実現するyoneoLocrというソフトウェアを開発しました。これを用いることで、撮影の失敗がなくなり、人間の操作を必要とせずに高品質なデータ測定が実現できます。
近年、クライオEMの単粒子解析と微小結晶の電子線三次元結晶構造解析は大きく注目されています。後者は生命科学に留まらず、合成化学、材料科学などでも利用が期待される技術です。今回開発したソフトウェアと測定技術により、今後、幅広い分野での応用研究を進めていきます。
補足説明
1.クライオ電子顕微鏡(クライオEM)
タンパク質などの生体分子を水溶液中の生理的な環境に近い状態で、電子顕微鏡で観察するために開発された手法。まず、試料を含む溶液を液体エタン(約-170℃)などの中に落下させて急速凍結し、アモルファス(非晶質、ガラス状)な薄い氷に包埋する。これを液体窒素(-196℃)冷却下で、電子顕微鏡観察する。電子顕微鏡内の真空中で試料は氷中に保持でき、また、冷却することで電子線の照射による損傷を減らせる。液体窒素冷却下もしくはそれ以下の温度での電子顕微鏡観察や、その装置自体のこともクライオEMと称する。
2.単粒子解析
電子顕微鏡で撮影した多数の生体分子の像から、その立体構造を決定する構造解析手法。結晶を作製しなくても分子の構造が得られる。技術革新により、理想的な試料ではX線結晶構造解析に勝る空間分解能で構造が決定できるようになった。2017年のノーベル化学賞の受賞者の一人、Joachim Frankらにより単粒子解析法の基礎がつくられた。
3.電子線三次元結晶構造解析
試料の微小で薄い結晶に電子線を照射して、その回折パターンから三次元の立体構造を決定する手法。電子はX線に比べて1万~10万倍も強く物質と相互作用するため、X線結晶構造解析に適さない微小で薄い単結晶が使用できる。電子の散乱特性からは、電荷に関する情報が得られる。Electron 3D crystallography、3D ED、マイクロEDとも呼ばれる。
4.回折パターン
電子線やX線が結晶性の試料に散乱され、干渉して回折を示す現象のこと。分子の並びを反映した規則的な回折点の並びなどの特徴的なパターンが観測される。
5.ディープラーニング
AIを実現するためコンピュータのプログラムに与えられた情報を学習させる手法(機械学習)の一つ。深層学習ともいう。神経細胞を模したニューラルネットワークを用いた多層構造が特徴で、従来のものに比べ高度な学習、情報の処理が可能となる。
6.オープンソース
ソフトウェアのプログラムの中身(ソース)を公開し、誰もが改造、改良することを可能とする形態。有名なオープンソースに、コンピュータの基本ソフトOS(Operating System)の一つであるLinuxがある。Githubはソフトウェアの公開をサポートするサービスを提供しており、YOLOやyoneoLocrもそこで公開されている。
7.分解能
どのくらい細かくものを「見る」ことができるかの指標。空間分解能の値が小さい(分解能が高い)ほど、物質をより精細に観測できる。原子の大きさは、1オングストローム(Å、1Åは100億分の1メートル)程度で、個々の原子の解像には、1Å程度の空間分解能が必要である。
研究支援
本研究は、科学技術振興機構(JST)未来社会創造事業(課題番号:JPMJMI20G5)、日本医療研究開発機構(AMED) 医療研究開発革新基盤創成事業 (CiCLE)、JST戦略的創造研究推進事業CREST(課題番号:JPMJCR18J2)などの助成を受けて行われました。
原論文情報
Koji Yonekura, Saori Maki-Yonekura, Hisashi Naitow, Tasuku Hamaguchi and Kiyofumi Takaba, “Machine learning-based real-time object locator/evaluator for cryo-EM data collection”, Communications Biology, 10.1038/s42003-021-02577-1
発表者
理化学研究所
放射光科学研究センター 利用技術開拓研究部門 生体機構研究グループ
グループディレクター 米倉 功治(よねくら こうじ)
(科技ハブ産連本部 バトンゾーン研究推進プログラム 理研-JEOL連携センター、次世代電子顕微鏡開発連携ユニット ユニットリーダー、東北大学 多元物質科学研究所 教授)
先任研究員 内藤 久志(ないとう ひさし)
研究員 浜口 祐(はまぐち たすく)
特別研究員 高場 圭章(たかば きよふみ)
XFEL研究開発部門 ビームライン研究開発グループ イメージング開発チーム
研究員 眞木 さおり(まき さおり)
報道担当
理化学研究所 広報室 報道担当
東北大学 多元物質科学研究所 広報情報室