光ではたらくロドプシンタンパク質の機能予測を行う人工知能システムを開発

スポンサーリンク

2018/10/24  名古屋工業大学,理化学研究所

名古屋工業大学大学院工学研究科情報工学専攻の竹内一郎教授(理化学研究所革新知能統合研究センター・データ駆動型生物医科学チーム・チームリーダーを兼任),烏山昌幸准教授と名古屋工業大学大学院工学研究科生命・応用化学専攻の神取秀樹教授(理化学研究所革新知能統合研究センター・データ駆動型生物医科学チーム・客員研究員),井上圭一准教授(所属は研究当時、現:東京大学物性研究所准教授、理化学研究所革新知能統合研究センター・データ駆動型生物医科学チーム・客員研究員)らは,光を吸収する機能を有するタンパク質である、ロドプシンの吸収波長をアミノ酸配列に基づいて予測するコンピュータアルゴリズムを、データ駆動型人工知能(機械学習)によって開発しました。さらに,予測をもとにロドプシンの一部を改変し,従来よりも長い吸収波長を持つ変異型ロドプシンを作製することに成功しました。

ロドプシンタンパク質は分子内部にレチナールと呼ばれる色素を結合しており、特定の波長の光を吸収できるため,動物の神経活動や行動を光で制御する光遺伝学などで重要な役割を担う機能性タンパク質として知られています。自然界に存在する多様な野生型のロドプシンに加え,人工的にアミノ酸の一部を改変することで,異なる吸光波長を持つ変異型のロドプシンを人工的に合成することができます。しかし,どのような改変を行えば,どのような吸光波長が得られるのかは合成して初めて明らかになることであり,多大な人的・費用的コストをかけて研究者の経験と勘による試行錯誤が繰り返されていました。本研究成果は,さまざまな野生型ロドプシンの吸光波長を超高速かつノーコストで予測できるだけでなく,特定の吸光波長を持つ変異型のロドプシンを設計指針としても有用なものです。本研究は名古屋工業大学と理化学研究所・革新知能統合研究センターの共同研究として実施された情報工学分野と生物化学分野の異分野連携による成果です。データ駆動型人工知能を用いて機能性タンパク質の機能予測を行う一般的な枠組を提供しており,ロドプシン以外の機能性タンパク質の予測や設計にも利用することができます。本研究の成果はScientific Reports誌第8号に掲載されました。

181024takeuchi1.jpg

図1:さまざまなロドプシンとその吸光波長の系統樹(アミノ酸配列の類似性をもとに作成されたもの)

181024takeuchi2.jpg図2:特定の野生型ロドプシン(KR2)とその変異型の計118種のロドプシンタンパク質の吸光波長を機械学習モデルによって予測した結果(赤丸)。平均誤差7.8nmの精度で吸光波長を予測することができた(F)

181024takeuchi3.jpg図3:機械学習モデルによって同定された、ロドプシンタンパク質中で特に吸光波長制御に影響の強い10個のアミノ酸。従来から生物学的研究で知られているアミノ酸に加え,これまで着目されていなかった残基を発見した

以下は、研究の詳細です。生物は動物の視覚や植物の光合成など様々な形で太陽光を利用し、自身の生存に役立てています。中でもロドプシンタンパク質は特定の波長を吸収する機能を有しており,ヒトを含む動物の視覚において光を捉え脳に情報を伝達するほか、細菌などの微生物において光のエネルギーを使って細胞内外にイオンを輸送するなど様々な役割を持つタンパク質です。そして自然界には6,000種類を超える様々なタイプのロドプシンタンパク質が存在することが知られています(図1参照)。また,ロドプシンタンパク質の吸光機能は光遺伝学とよばれる神経科学分野のツールとして有用であり,自然界に存在する野生型のロドプシンタンパク質のアミノ酸の一部を人工的に改変し,目的に応じた吸光波長を持つ変異型ロドプシンタンパク質をつくる試みもなされています。名古屋工業大学大学院工学研究科生命・応用化学専攻の神取研究室では,これまで,さまざまな野生型,変異型ロドプシンに関する生物化学的研究を行っており,数多くのロドプシンタンパク質に関する知見が得られています。本研究では,神取研究室のこれまでの研究成果に加え,世界中の研究室から論文として公表された全ての研究成果をまとめ,796種の微生物由来のロドプシンタンパク質に関するデータベースを構築しました。このデータベースには各ロドプシンタンパク質のアミノ酸配列と吸光波長が記録されています。本研究では,このデータベースを訓練データとして用い,データ駆動型人工知能技術によってロドプシンタンパク質の吸光波長を予測するためのコンピュータアルゴリズムを開発しました。データ駆動型人工知能とは過去のデータを訓練データとして新たなデータを予測するための機械学習と呼ばれる技術に基づいています。本研究では,特に,グループスパース正則化と呼ばれる機械学習アルゴリズムを用いることで,ロドプシンの吸光波長を高精度で予測するモデルを作成しました。この予測モデルを利用することで,吸光波長のわかっていないロドプシンファミリーに対し,平均誤差が7.8 nmで吸光波長を予測できることを示しました(図2参照)。また,機械学習モデルを分析することで吸光波長の制御に強く影響を与えるアミノ酸に関する生物学的知見を得ることができました(図3参照)。さらに,予測モデルをもとに野生型ロドプシンの一部のアミノ酸を改変し,従来よりも長い吸光波長を持つ変異型ロドプシンを作製することに成功しました。本研究はデータ駆動型人工知能(機械学習)を用いてタンパク質の機能予測を行う汎用的な枠組を提供するもので,他の機能性タンパク質の機能予測や設計にも活用することができます。

Understanding Colour Tuning Rules and Predicting Absorption Wavelengths of Microbial Rhodopsins by Data-Driven Machine-Learning Approach.
Masayuki Karasuyama, Keiichi Inoue, Ryoko Nakamura, Hideki Kandori and Ichiro Takeuchi.
Scientific Reports 8, Article number: 15580 (2018). www.nature.com/articles/s41598-018-33984-w

お問い合わせ先
研究に関すること

名古屋工業大学大学院工学研究科 情報工学専攻(理化学研究所・革新知能統合研究センター・チームリーダー兼任)
教授 竹内 一郎

名古屋工業大学大学院工学研究科 生命・応用化学専攻
教授 神取 秀樹

広報に関すること

名古屋工業大学 企画広報課

理化学研究所 広報室 報道担当

スポンサーリンク
スポンサーリンク