天然魚類と環境水・底泥のエコインフォマティクス

スポンサーリンク
社会科学的手法を取り入れ複雑系の環境因子から関係性を「見える化」

2018年2月22日 理化学研究所

要旨

理化学研究所(理研)環境資源科学研究センター環境代謝分析研究チームの菊地淳チームリーダー、魏菲菲特別研究員らの研究チームは、天然魚類と環境水や底泥の分析ビッグデータ[1]から鍵因子情報を抽出する「エコインフォマティクス[2]」により、水温差や抱卵に特徴的な恒常性摂動[3]を「見える化」しました。

ヒトの恒常性(≒健康)が周囲の気温、湿度、栄養、微生物といった物理・化学・生物因子で摂動するように、環境の恒常性(≒健康)も生態系サービス[4]に関わる多彩な物理・化学・生物因子で摂動しています。例えば、天然魚は水温上昇でオス化したり、日長条件が産卵の鍵因子であるなど、わずかな環境変化を敏感に察知しながら過酷な自然環境下で生き延びています。したがって、自然環境の試料を多様な角度から分析する環境要因解析の手法を高度化することで、自然環境という複雑系[5]を「見える化」することができます。

今回、研究チームは、日本各地・各時期の天然魚類マハゼとその代表的な生息地の水と底泥のメタボローム(代謝産物の総体)・イオノーム(無機元素の総体)・マイクロバイオーム(微生物叢)や表現型[6]に関するビッグデータを収集しました。そのビッグテータを用いて、生息地の水温差や成長・抱卵などに関連する鍵因子情報を抽出するエコインフォマティクスを開発しました。表現型には定性的なデータも存在するため、各機器分析から得られる定量的データと統合解析ができるマーケットバスケット分析(MBA)法[7]や、各種の多変量解析[8]に基づく分類および関係性情報抽出を組み合わせて、生息地の水温差や抱卵に特徴的な代謝および腸内細菌叢摂動を視覚化しました。これまでのゲノム配列やタンパク質などの比較・特性解析を行うバイオインフォマティクスや、元素や官能基などの構造・特性解析を行うケモインフォマティクスに対して、エコインフォマティクスは環境に生息する魚類、水や底泥の物理・化学・生物因子の分類や関係性、鍵因子を抽出する手法です。MBA法のように政治や経済といった複雑系を解析する社会科学で用いられる手法を用いたことで、環境という複雑系に内因する、弱い相互作用の関係性を浮き彫りにすることができました。一つの例として、酢酸を鍵因子とするエネルギー代謝の関係性をネットワーク抽画して示すことができました。

今後、エコインフォマティクスによって得られた重要な鍵因子の変動から生態系のバランスが崩れる前に環境の変動を予測することや、鍵因子を制御することで生態環境が改善できる可能性があります。将来的には、解析結果を環境持続性の評価指針とするといった展開も期待できます。

本研究は、米国のオンライン科学雑誌『Scientific Reports』(2月22日付け:日本時間2月22日)に掲載されます。

※研究チーム

理化学研究所 環境資源科学研究センター 環境代謝分析研究チーム
チームリーダー 菊地 淳 (きくち じゅん)
特別研究員 魏 菲菲 (ウェイ フェイフェイ)
テクニカルスタッフ 坂田 研二(さかた けんじ)
テクニカルスタッフ 朝倉 大河(あさくら たいが)
研究員 伊達 康博(だて やすひろ)

背景

2015年に国連持続可能な開発サミットが開催され、「持続可能な開発目標(Sustainable Development Goals:SDGs)が採択されました。かつての高度経済成長期には大量生産・大量消費をしていた日本をはじめ、世界各国で持続可能な産業・社会のあり方に高い関心が寄せられています。特に自然環境の生態系サービスからは、物質循環などの基盤サービス、水や食料などの供給サービス、気候などの調整サービス、生物多様性などの保全サービス、景観やレクリエーションなどの文化的サービスを享受しており、美しい地球の営みとヒトの生活環境はかけがえのない関係性を持っています。

ヒトの恒常性(≒健康)が周囲の気温、湿度、栄養、病原(有益)微生物といった物理・化学・生物因子で摂動するように、環境の恒常性(≒健康)も生態系サービスに関わる多彩な物理・化学・生物因子で摂動しています。したがって、自然環境の試料を多様な角度から分析する環境要因解析の手法を高度化することで、自然環境という複雑系を「見える化」することが可能といえます。

菊地チームリーダーらはこれまでに、天然海藻注2)や河口底泥注3)など、自然環境のさまざまな試料を採取し、多検体計測に向く核磁気共鳴(NMR)[9]法、誘導結合プラズマ発光分光(ICP-OES)法[10]、次世代シーケンサー(NGS)[11]といった各種分析によりビッグデータを収集し、多変量解析手法を駆使して天然ヒジキの「旬」成分の変化や、底泥の富栄養化に基づく微生物叢変化などの「見える化」を推進してきました。

天然魚は水温上昇でオス化したり、日長条件が産卵の鍵因子であったりと、わずかな環境変化を敏感に察知しながら過酷な自然環境下で生き延びています。そこで今回、天然魚類および腸内細菌叢、海水および底泥試料に着目し、天然魚生息システムの恒常性を解析して「見える化」することを試みました(図1)。

注2)2014年1月14日プレスリリース「海藻類の有機・無機成分複雑系の統合解析技術を構築
注3)2014年5月15日プレスリリース「河口底泥の環境分析データの統合的評価と“見える化”

研究手法と成果

研究チームは、日本各地・各時期において天然魚マハゼを1,022サンプル、およびその代表的な棲息地の水や底泥をそれぞれ66サンプル採集しました。その中には、メタボローム(代謝産物の総体)・イオノーム(無機元素の総体)・マイクロバイオーム(微生物叢)やフェノーム(表現型)に関するビッグデータが含まれています。

まず、マハゼの筋肉代謝プロファイルを得るため、得られたサンプルの筋肉組織のNMR計測を行いました。そして、得られたNMRに基づく代謝物の情報と、体長、体重、抱卵の有無などの表現型ファクターと、採集場所、採集季節、水温などの環境因子と一緒にマーケットバスケット分析(MBA)法を行いました。

MBA法は、データマイニング[12]で用いられる解析手法の一つで、「よく一緒に買われる商品」を見つけるためのデータ分析として、インターネットショッピングやスーパーなどの販売業者が利用しています。MBA法では、代謝物量のような定量的な情報だけではなく、表現型や環境因子などの定性的な因子も一緒に取り込んで、組み合わせなどの関連性を探索することができます。このため、環境試料から得られる物理・化学・生物因子のビッグデータを解析するためのパラメータ数や多様性が膨大となる「エコインフォマティクス」へ応用できます(図2)。

MBAネットワークで各因子間の相関性を調べたところ、高体重、高体長、抱卵有などの高い成長段階を示す大型個体群の表現型因子は、脂質、乳酸、イノシン酸などの代謝物と高い相関を示すことが分かりました。一方、低い成長段階を示す小型個体群のマハゼの筋肉には、分岐鎖アミノ酸(ロイシン、イソロイシン、バリン)、イノシンなどの代謝物が多く含まれることが分かりました。

生息地による違いを解明するために、多変量解析の一つである部分最小二乗判別分析(PLS-DA)[8]を用いて、筋肉代謝プロファイルでは関東から東北、北海道という地域の差異を抽出しました。つまり、生息地緯度の違いによる水温の変化に伴う、代謝プロファイルの変動を捉えることができました(図3左)。

次に、抱卵に関わる重要な代謝物因子を抽出するため、抱卵有、抱卵無の2群に対してボルケーノプロット[13]を示したところ、抱卵したマハゼの筋肉にはタウリン、脂質、乳酸、クレアチンなどの代謝物が多く含まれ、抱卵しないマハゼの筋肉にはアミノ酸、イノシン、酢酸などの代謝物が多く含まれていました(図3右)。そこで、水と底泥も含む代謝物、無機元素、微生物プロファイリングの結果を用いて、マハゼ生息システムの相関ネットワークを構築しました。その中から例えば、酢酸に注目すると、筋肉の中の酢酸含有量は、底泥環境中のカリウム、鉄、マグネシウム、コバルトなどの無機元素と負の相関を、腸内の非飽和脂質、イノシンなどの肉食性成分と負の相関を、腸内の植物食性由来の光合成微生物と正の相関を示すことが分かりました(図4)。

これらの結果と既報文献より、酢酸は脂質成分の分解産物として生物体にエネルギーを提供できる物質であり、雑食性の野生マハゼの抱卵無グループで有意に酢酸が蓄積された原因の一つとして、抱卵に重要な役割を果たす脂質が十分に取られていないため、脂質がエネルギー物質として分解された可能性が示されました。このように、エコインフォマティクスにより酢酸を鍵因子とするエネルギー代謝の関係性をネットワーク抽画できたことを示しています。

今後の期待

昨今では、多様な気象センサーやドローンなどを利用することで、自然環境の物理・化学情報や、植物・動物群集の動態などのビッグデータを容易に得られるようになりました。一方で、本研究で用いたNMRやICP-OESなど、1検体あたりのランニングコストが安価な分析機器を利用することで、化学因子情報やNGSによる微生物因子のデータ収集ができるようになりました。このような、環境試料から物理・化学・生物因子のビッグデータ収集が低コストかつ多検体で得られる時代の到来により、多因子情報を統合解析して「見える化」するエコインフォマティクス手法の高度化が望まれています。また、複雑な多因子が関与する環境試料のビッグデータ解析には、人工知能、特に深層学習との組み合わせが有効です注1)

また、本研究のような環境試料研究が対象とする複雑系は、脳、進化、生態系などの生物が関わる現象から、政治や経済にいたる自然・社会・人文科学といった広い分野で研究対象となっています。複雑系の大きな特徴は多様性、柔軟性、頑強性と弱い相互作用にあり、強い因果関係にある因子のみを抽出する還元主義的アプローチとは異なります。本研究で、MBAを用いたのは、このような複雑系を的確に分析するためのアプローチです。これまでの計算機の急速な進歩が人工知能研究を加速させましたが、今後は時空間での連続的なデータ取得が可能なIoT計測機器の台頭により、環境・ヒト・社会に関わる弱い相互作用が着目され始めると考えられます。

今回開発した手法は、天然魚類の表現型や腸内細菌叢と、生息地の水と底泥の各種分析情報の分類、関係性、マーカー情報の同定を可能にします。これらの手法を用いて、生態系の恒常性維持に関わるルールと重要な鍵因子の抽出も可能になりました。今回開発したエコインフォマティクス技術を用いて、鍵因子の変動から生態系のバランスが崩れる前に、環境の変動を予測・早期警告をすることが期待できます(図5)。さらに、鍵因子を制御することで生態環境が改善される可能性があります。将来的には、自然の恵みを効率よく上手に利用するために、生態環境持続性の評価指針としての展開へも期待できます。

注1)2018年1月24日プレスリリース「深層学習を用いた重要代謝物探索法

原論文情報
  • Wei, F., Sakata, K., Asakura, T., Date, Y. and Kikuchi, J.*, “Systemic Homeostasis in Metabolome, Ionome and Microbiome of Wild Yellowfin Goby in Estuarine Ecosystem”, Scientific Reports, doi: 10.1038/s41598-018-20120-x
発表者

理化学研究所
環境資源科学研究センター 環境代謝分析研究チーム
チームリーダー 菊地 淳 (きくち じゅん)
特別研究員 魏 菲菲 (ウェイ フェイフェイ)

報道担当

理化学研究所 広報室 報道担当

産業利用に関するお問い合わせ

理化学研究所 産業連携本部 連携推進部

補足説明
  1. 分析ビッグデータ
    一般的なデータ管理・処理ソフトウエアで扱うことが困難なほど巨大で複雑なデータの集合。昨今の生命科学研究、特にオミクス研究では遺伝子や代謝物数などのパラメータ(p)情報を大量取得し、一方で1試料あたりのランニングコストが高価なので試料数(n)が少ない、n<p型のビッグデータ取得を行う傾向がみられた。しかし、分析コストが安価で再現性の高い分析機器を用いれば、n>p型のビッグデータ取得が可能となる。本研究では、こうした実験デザインを基本概念としている。
  2. エコインフォマティクス
    生物を構成するゲノム配列やタンパク質などの比較・特性解析を行うバイオインフォマティクス、化学物質を構成する元素や官能基などの構造・特性解析を行うケモインフォマティクスと呼ぶのに対し、本研究では着目環境に生息する魚類、水や底泥の物理・化学・生物因子の分類・関係性・重要因子抽出をエコインフォマティクスと呼ぶこととした。
  3. 恒常性摂動
    生物や環境などにおいて、その内部環境を一定の状態に保ち続けようとする傾向のこと。
  4. 生態系サービス
    人類が生態系から得ている利益。 淡水・食料・燃料などの供給サービス、気候・大気成分・生物数などの調整サービス、精神的充足やレクリエーション機会の提供などの文化的サービス、酸素の生成・土壌形成・栄養や水の循環などの基盤サービスがある。 生態系サービスは生物多様性によって支えられている。
  5. 複雑系
    相互に関連する複数の因子が合わさって全体として何らかの性質やそうした性質から導かれる振る舞いをみせる系であるが、全体としての挙動は個々の要因や部分からは不明なものをいう。脳、進化、生態系などの生物が関わる現象から、政治や経済にいたるまで、あらゆる分野での研究対象となっている。特に物理学分野で前世紀後半からカオス、フラクタル、揺らぎといった研究分野が台頭し、世界、特に米国西海岸で人工知能研究が着目され始めた時期とも一致する。
  6. 表現型
    ある生物の持つ遺伝子型が形質として表現されたもの。その生物の形態、構造、行動、生理的性質などを含む。
  7. マーケットバスケット分析(MBA)
    社会科学や特に経済学分野において、データマイニングで用いられる解析手法の一つで、“よく一緒に買われる商品”を見つけるためのアソシエーション分析。解析者の定めたアソシエーション・ルールに基づくネットワーク抽画により、機器分析から得られる定量的情報と、生物表現型などの定性的情報を統合解析することが可能となる。
  8. 多変量解析、部分最小二乗判別分析(PLS-DA)
    多変量解析は複数の変数からなる多変量データを統計的に扱う手法。大量のデータから主要因子を取り出すデータマイニングにおいてよく使われる解析法で、代表的なものとして主成分分析(PCA)、部分最小二乗判別分析(PLS-DA)、独立成分分析(ICA)、非負値行列因子分解(NMF)、多変量波形分解(MCR)が挙げられる。PLS-DAは、正常と異常といった二つのグループ間の差が最大になるようにモデルを考える。そのときに大きく関与する変数に相当する物質がバイオマーカー候補となる。
  9. 核磁気共鳴(NMR)
    原子や分子は、静磁場中で外部からエネルギーを与えると、構造に特徴的なエネルギーを吸収、放出する。エネルギーの強さ(周波数)を変えながら吸収・放出を計測することで物質に固有の波形(スペクトル)が得られる。混合物の場合は個々の物質由来のスペクトルが足しあわされた波形が得られるので、スペクトルを調べることでどんな物質が混合されているかを知ることができる。試料を何らかの方法でイオン化しなければならない質量分析法とくらべ、NMRでは食品や生体試料を最小限の前処理で、イオン化する必要なくそのまま計測できる特徴を持つ。NMRはNuclear Magnetic Resonanceの略。
  10. 誘導結合プラズマ発光分光(ICP-OES)法
    ICPは、気体に高電圧をかけることによってプラズマ化させ、さらに高周波数の変動磁場でプラズマ内部に渦電流によるジュール熱を発生させて得られる高温のプラズマ。ICPによってサンプルを原子化・熱励起し、これが基底状態に戻る際の発光スペクトルから元素の同定・定量を行う方法。
  11. 次世代シーケンサー(NGS)
    サンガー法を利用した蛍光キャピラリーシーケンサーである「第一世代シーケンサー」と対比させて使われている用語。多数のDNA断片を同時並行で解析し、大量の配列を読み取ることができるDNA配列解析装置。
  12. データマイニング
    統計学、パターン認識、人工知能などのデータ解析の技法を、大量のデータに網羅的に適用することで知識を取り出す技術のこと。
  13. ボルケーノプロット
    それぞれの代謝物質について試験群間の比をlog2変換し横軸に、t検定結果のp値をlog10変換し縦軸に示した散布図である。 群間比較で顕著にかつ統計学的有意に、高値または低値の代謝物質群をひと目で把握できる。

本研究で実施した天然魚生育システムの恒常性解析の図

図1 本研究で実施した天然魚生育システムの恒常性解析

本研究では天然魚類および腸内細菌叢、海水および底泥試料に着目し、天然魚生息システムの恒常性の解析を行った。核磁気共鳴(NMR)法、誘導結合プラズマ発光分光(ICP-OES)法、次世代シーケンサー(NGS)を用いて得られる、天然魚の多種多様な表現型や生息地海水や底泥の複雑な環境因子といったビッグデータを、エコインフォマティクス手法を駆使して「見える化」していく。

社会科学で用いられるマーケットバスケット分析(MBA)法を利用の図

図2 社会科学で用いられるマーケットバスケット分析(MBA)法を利用

MBAでは解析者の定めた「アソシエーション・ルール」に基づき、天然魚の表現型(成長段階や抱卵)のような定性的情報と、NMR法で計測される定量的情報との関係性を「見える化」することができる。

天然マハゼの棲息環境や表現型に強く関与する代謝プロファイルの図

図3 天然マハゼの棲息環境や表現型に強く関与する代謝プロファイル

棲息地域の水温差に基づく代謝プロファイルの違い(左)と、抱卵の有無という表現型の違いを特徴付ける代謝物(右)

マハゼ宿主、腸内細菌叢、環境水、底泥の計測因子間の相関ネットワーク解析の図

図4 マハゼ宿主、腸内細菌叢、環境水、底泥の計測因子間の相関ネットワーク解析

複雑な多因子ネットワークの「ビッグデータ」(右)から、特に筋肉中酢酸と環境因子との関係性を拡大図とした(左)

エコインフォマティクスによる生態系変化予測とその応用の図

図5 エコインフォマティクスによる生態系変化予測とその応用

今回開発したエコインフォマティクス技術を用いることで、重要な鍵因子の変動から生態系のバランスが崩れる前に環境の変動を予測・早期警告をすることや、鍵因子を制御することで生態環境が改善される可能性がある。

スポンサーリンク
スポンサーリンク