質量分析インフォマティクスと安定同位体標識植物の統合解析
2019-03-29 理化学研究所,千葉大学,科学技術振興機構
理化学研究所(理研) 環境資源科学研究センター メタボローム情報研究チームの津川 裕司 研究員、有田 正規 チームリーダー、統合メタボロミクス研究グループの中林 亮 研究員、斉藤 和季 グループディレクター(千葉大学 大学院薬学研究院 教授)らの国際共同研究グループは、植物が産生する多様な代謝物(メタボローム)を包括的に捉えるための新たな「質量分析インフォマティクス注1)」技術の開発を行いました(図)。
本研究成果は、創薬研究におけるシード探索や新しい代謝物の発見、および代謝物を起点とした生命現象の理解に貢献すると期待できます。また、本技術は植物だけでなく、多様な生物に応用可能です。
今回、国際共同研究グループは、安定同位体で標識した二酸化炭素(13CO2)で生育させた植物体と通常条件下(12CO2)で生育させた植物体を、質量分析装置で測定しました。得られた計測データを統合し、①未知代謝物の炭素数の決定、②得られた炭素数をもとにした組成式の算出、③組成式とMS/MSスペクトル注2)の情報からの代謝物クラスの分類・化合物部分骨格の決定、④上記結果と元のMS/MSスペクトルデータのネットワークによる可視化、の4つができる「統合解析プログラム(MS-DIAL 3.0)」を開発しました。そして、これらを用いることで、合計12植物種より1,133種の代謝物構造情報を得ることに成功し、モデル植物であるシロイヌナズナを用いた解析では環境因子と関連する複数の代謝物を新たに見いだすことに成功しました。
本研究成果は、国際科学雑誌「Nature Methods」の掲載に先立ち、オンライン版(2019年3月28日付け:日本時間3月29日)に掲載されます。
本研究は、科学技術振興機構(JST) ライフサイエンスデータベース統合推進事業 統合化推進プログラム「物質循環を考慮したメタボロミクス情報基盤(研究代表者:有田 正規)」および国際科学技術共同研究推進事業 戦略的国際共同研究プログラム(SICORP)、農研機構(NARO) 生物系特定産業技術研究支援センター イノベーション創出強化研究推進事業、日本学術振興会(JSPS) 基盤研究「統合オミクス研究に資する質量分析インフォマティクスによる新規代謝制御機構の解明(研究代表者:津川 裕司)」および新学術領域研究「植物二次代謝経路のゲノム進化に学ぶ生合成デザイン」(研究代表者:山崎 真巳)、千葉大学 戦略的重点研究強化プログラム「ファイトケミカル植物分子科学」の支援を受けて行われました。
<背景>
ヒトは、主にたんぱく質、糖質、脂質を摂取し代謝することで、体を構成する細胞や生命活動のためのエネルギー、および生体反応をつかさどるシグナル伝達物質などさまざまな化学成分である代謝物(メタボローム)を作り出します。一方、植物では主に二酸化炭素を栄養源として、医薬に応用されるアルカロイドやサポニンに加え、動物の必須栄養素となり得るさまざまな代謝物を作ります。
作り出せる代謝物の数は生物によってさまざまであり、大腸菌では700種類、ヒトでは3,000種類と言われています。一方植物界では、植物種ごとに固有の代謝物(植物特異的代謝物または二次代謝物と呼ばれる)が生産されることが知られており、モデル植物であるシロイヌナズナでは3,000種類、そして20万種以上の植物種が確認されている植物界全体では、100万種類を超える代謝物が生産されると考えられています。これらの中には、化学構造が未解明なものも数多く残されており、新たな創薬シードや香料、エネルギー生産に寄与するバイオエタノール、そして気候変動に対応するための新たな代謝物制御機構の解明といった多方面での発展が期待される代謝物が含まれています。
また、植物に限らず、“代謝物が、どこで、いつ、どのようにして、なぜ作られるのか”についてはほとんど明らかになっていません。そこで、生体内にどのような代謝物がどれくらい存在するかを網羅的に測定・解析する手法である「メタボローム解析」が、新たな代謝物の発見や生命を理解する上で必須であり、これまでさまざまな研究開発が進められてきました。
津川 裕司 研究員らはこれまで、質量分析より得られるビッグデータから高精度かつ高速に代謝物情報を得るための「質量分析インフォマティクス」を基盤としたさまざまな研究を行ってきました。中でも、生物中に含まれる「脂質」を網羅的に捉える手法の開発※1)、代謝の中枢を成す「一次代謝産物および疾患特異的に蓄積するエラー代謝物」を包括的に捉える手法の開発※2)などは、世界に先駆けて行ったものです。
今回、植物が産生する多様な物理化学的性質を持つ代謝物構造を網羅的に捉えるための質量分析インフォマティクスの研究を行いました。
<研究手法と成果>
質量分析装置を用いて代謝物構造を決定するためには、計測される「マススペクトル(MS/MSスペクトル)」を解読しなければなりません。MS/MSスペクトルとは、質量分析装置内で代謝物にエネルギーを加えることで、その構造特異的な「マスフラグメンテーション(断片化)」を起こさせ、これら断片化イオンを計測したものです。そのため、MS/MSスペクトルの中には、代謝物の部分構造および結合配置の情報などが豊富に含まれています(図1)。しかし、植物が産生する代謝物は膨大かつ複雑な構造であるため、MS/MSスペクトルの関連性を見いだすことは難しく、新たな解析技術の開発が必要でした。
そこで、国際共同研究グループはまず、安定同位体で標識した二酸化炭素(13CO2)で生育させた植物体と通常条件下(12CO2)で生育させた植物体について、それぞれ液体クロマトグラフィー質量分析法(LC-MS)注3)で計測したデータを用いて、未同定代謝物の「炭素数」を決定することを試みました。
質量分析とは代謝物の「質量」を測定する方法です。例えば、炭素を6つ含む化合物のグルコースを13Cで置換すると、通常よりも6つ重い位置に「重くなったグルコース」が検出されることになります。この「質量シフト」を捉えることで、未知代謝物の炭素数が決定できます。そこで、13CO2と12CO2植物データより得られる何千個もの代謝物情報を同時に解析し、その全ての炭素数を迅速に決定するためのアルゴリズムを開発しました(図2)。
また、得られた炭素数から組成式(例えばグルコースならC6H12O6)を高精度に算出するアルゴリズムも開発し、生体構成有機元素(C、H、N、O、P、S)で構成される代謝物組成式を99.8%以上の精度で決定できる基盤を構築しました。さらに、既存のデータベースに含まれる化合物構造とMS/MSスペクトルの関係性を機械学習注4)によって関連付け、未知のMS/MSスペクトルから「代謝物クラス(例えば、フラボノイド群、グルコシノレート群、ステロイド群など)」を予測し、含まれる部分構造を決定するためのアルゴリズムも開発しました(精度80%以上)。
そして、以上の基盤技術を用いて、モデル植物であるシロイヌナズナや、農作物として重要なイネ、トウモロコシ、トマト、ジャガイモや、薬用植物として知られる甘草、タバコ、そして抗がん剤として用いられるカンプトテシンを含むアルカロイドを多く産生するチャボイナモリを含む合計12植物の葉、根、果実などさまざまな部位を測定しました。その結果、3,604種の植物代謝物の炭素数を決定し、そのうち1,133種の組成式を決定することに成功しました。このうち、69個が本研究によって見いだされた新規の代謝物でした。
さらに、得られるMS/MSスペクトルと予測された代謝物クラスや部分構造をもとに、各植物代謝物をひも付ける「植物代謝物-MS/MSスペクトルネットワーク」を構築することで、すでに構造が決定できているMS/MSスペクトルと未知のMS/MSスペクトル情報との関連性を見いだすアルゴリズムを構築しました(図3)。
これらの機能を2015年より開発が行われている質量分析データ統合解析プログラムであるMS-DIAL(MS-DIAL 3.0)に組み込み、解析を行いました。このネットワーク解析の結果と文献情報を照らし合わせながら、合計で824の植物代謝物の構造を割り当てることに成功し、このうちの505種類(組成式のみ決定できたものを含めると721種類)が植物の「科(イネ科、ナス科など)」単位で独立して産生されていることを見いだしました。植物研究ではこれまで、「各植物は、その植物種特異的な代謝物を作り出す」と考えられてきましたが、本研究によりそれが具体的に証明されました。
最後に、植物進化や環境因子との関連解析に広く用いられている、世界の各地で自生しているシロイヌナズナ自然変異体に対しても本手法を適用することにより、開花時間や乾燥ストレス、および窒素飢餓状態などさまざまな環境因子に関連のある代謝物(グルコシノレートやその分解物、そしてフェノールアミドやモノリグノール硫酸抱合体など)を新たに見いだし、本手法が代謝物の構造情報を決定するだけでなく、さまざまな表現型との関連解析にも適用可能な技術であることを示しました。
<今後の期待>
植物は多様な代謝物を産生し、その一つ一つが研究対象となっています。環境ストレスに関連が報告されているフラボノイド(抗酸化作用が報告されているカテキンも含む)、バイオエタノールとして利用されるリグニン、さまざまな生理活性を持つアルカロイド、テルペノイド、サポニンなどがその一例です。本研究で開発された技術は、その全ての植物代謝物クラスを捉えられるだけでなく、本研究でも69個の新規な代謝物が見いだされたように新しい代謝物構造も提案できる画期的な技術です。
本研究成果は、このような植物由来天然物の新規創薬スクリーニングに貢献できるだけでなく、代謝物の観点から生命を捉え、それが遺伝子やたんぱく質とどのように関わって生体恒常性維持に寄与するかといった基礎研究にも適用可能な技術と考えられます。また、本研究で用いている安定同位体標識はワークフローには必須ではなく、一般性の高い手法です。研究グループで開発が進められているMS-DIALは、マウスやヒトの代謝研究にも幅広く適用可能な解析プログラムとなっており、今後の社会に大きく貢献することが期待されます。
<参考図>
図 本研究により明らかになった植物代謝物ネットワーク
図1 代謝物の構造とMS/MSスペクトルの関係
代謝物は質量分析内において、構造特異的なマスフラグメンテーションを引き起こし、それがMS/MSスペクトルとして計測される。MS/MSスペクトルをひも解くと、代謝物の部分構造が見えてくる。例えば、環境ストレスとの関連が報告されているフラボノール配糖体(右の構造式)とMS/MSスペクトルの関係を例にすると、スペクトルピークの質量差分から、ヘキソースとデオキシヘキソースが結合している分子であることが分かる。また、フラボノール特異的なイオン(m/z 287)から、母骨格はkaempferol(ケンフェロール、左の構造式)であることも分かる。このように、本研究では約10,000種の代謝物のMS/MSスペクトル情報を用いて、MS/MSスペクトルから化合物クラスと部分構造を予測するための機械学習モデルを構築した。
図2 代謝物を構成する炭素数の決定
安定同位体標識植物と通常条件下で生育させた植物を用いることにより、代謝物中の炭素数を網羅的に決定するためのアルゴリズムを構築した。図において、青は通常条件下で育てた植物の代謝物由来イオン、赤は安定同位体標識された植物の代謝物由来イオンの同位体パターンを示す。質量分析では、代謝物の組成に依存した同位体パターンが存在し、これを用いることにより「同一代謝物由来のイオンをグループ化」することが可能となる。
図3 植物代謝物ネットワークの応用例
本研究により決定された植物代謝物の組成式、代謝物クラス、部分構造そしてMS/MSスペクトルの類似性に基づき植物代謝ネットワークを構築する方法を開発した。植物代謝物ネットワーク全体から一部を抜き出して見てみると、「グルコシノレート」という代謝物クラスが、そのMS/MSスペクトルの類似性から凝集していることが分かる。さらに、本研究以前では未解明であった分子に関して、グルコシノレートとのMS/MS類似性から、「グルコシノレートに類似した部分構造」を持つであろう候補の構造が絞り出せる。一例として、右の点線枠に示したように、12スフフォオキソジャスモン酸(下の構造式)やグルコバニリンスルフォン酸(上の構造式)がクラスターとして、同定された。このクラスターは、スルフォン酸と糖の骨格を持つ構造由来のMS/MSパターンを認識して形成されていることが分かる。このように「既知の代謝物情報から未知の代謝物構造」を帰納法的に解明していくことで、最終的には1,133種類の代謝物情報を得ることが可能となった。
<用語解説>
- 注1)質量分析インフォマティクス
- 質量分析は、代謝物をイオン化し、そのイオンを検出することにより、原子や分子の質量を測定する分析法。そのイオンの検出量から、代謝物の含有量を調べることができる。また質量分析装置内で、代謝物に高エネルギーを付加し、断片化させて代謝物特異的なマススペクトル(MS/MSスペクトル)を取得することで、化学構造の推定も可能である。質量分析インフォマティクスという言葉は、このような質量分析データを解析するための情報科学分野として生まれてきた言葉で、メタボローム解析(代謝物の包括的解析)やプロテオーム解析(たんぱく質の包括的解析)で得られる複雑な質量分析ビッグデータから、生物情報を高精度かつ円滑に得るための方法論の研究開発が行われる。
- 注2)MS/MSスペクトル
- 「MS/MS」は「エムエスエムエス」と読む。質量分析装置内でイオン化された化合物に、ある一定以上の高エネルギーを付加すると、マスフラグメンテーションという化合物断片化が引き起こされる。それぞれの断片は、まだイオン化されたままであり、その断片化イオンが検出されることで、断片質量とそのイオン強度に基づいたマススペクトル(MS/MSスペクトル)が得られる。横軸には、断片化イオンの質量をその電荷で割った値(m/z:エムオーバージーと読む)、縦軸には断片化イオンの強度が記録される。断片化イオン間の質量差分はニュートラルロスと呼ばれ、質量単位であるDa(ダルトン)が単位として用いられる。このMS/MSスペクトルは、化合物ごとに特徴的な傾向を示すため、化合物の構造推定の重要なヒントとなる。
- 注3)液体クロマトグラフィー質量分析法(LC-MS)
- 液体クロマトグラフィーで分離した代謝物を、質量分析部でイオン化して質量検出器で分析する方法。現在頻用される液体クロマトグラフィータンデム質量分析(LC-MS/MS)を用いれば、代謝物のイオン量に加え、その代謝物特異的なMS/MSスペクトルを同時に取得可能である。
- 注4)機械学習
- 本研究では、コンピューター(機械)にMS/MSスペクトルと代謝物構造のデータから関係性を見いだしてもらい(学習)、その学習させたコンピューターにMS/MSスペクトルを読み込ませたとき、そのMS/MSスペクトルがどのような代謝物構造かを予測させる「機械学習モデル」を作成した。
<参考文献>
※1)2015年5月5日プレスリリース「生体内の低分子化合物を網羅的に捉える解析プログラムを開発」
http://www.riken.jp/pr/press/2015/20150505_1/
※2)2017年11月28日プレスリリース「未開拓の代謝物を次世代メタボローム解析により発見」
http://www.riken.jp/pr/press/2017/20171128_1/
<論文情報>
- タイトル:“A cheminformatics approach to characterize metabolomes in stable isotope-labeled organisms”
- DOI:10.1038/s41592-019-0358-2
<お問い合わせ先>
<研究に関すること>
津川 裕司(ツガワ ヒロシ)
理化学研究所 環境資源科学研究センター メタボローム情報研究チーム 研究員
理化学研究所 生命医科学研究センター メタボローム研究チーム 研究員
<JST事業に関すること>
科学技術振興機構 バイオサイエンスデータベースセンター 企画運営室
<報道担当>
理化学研究所 広報室 報道担当
千葉大学 渉外企画課 広報室
科学技術振興機構 広報課