2020-02-10 情報・システム研究機構
ビッグデータ時代を背景に、企業や地域など社会の中のさまざまな活動に、データを活かしていこうという動きが盛んだ。これまで公開されていなかった学術の研究データも、誰もがアクセスでき、活用できるよう変わりつつある。そもそも研究活動の多くは公的資金で行われていることから、国民はその成果を当然に知る権利がある。このような認識は日本でも、最初は特に設備などに資金が必要な天文学、素粒子物理学などの分野から、徐々に学術全体へと広がってきた。なかでも東京大学は、研究データを集めて、広く社会の中の利活用に供する「データ活用型社会創成プラットフォーム」の構築を進めている。プロジェクトを率いる東京大学相原博昭副学長を、国立情報学研究所オープンサイエンス基盤研究センターの船守美穂准教授と訪ねた。
答える人:相原博昭 大学執行役・副学長(東京大学)
あいはら・ひろあき。東京大学大学執行役・副学長、教授。専門は高エネルギー加速器を使った素粒子物理の実験的研究。1978年東京大学理学部物理学科卒、1984年同研究科博士課程終了、同助手。同年、理学博士(東京大学)。1995年東京大学助教授、2003年同教授。1995年国立フェルミ研究所での共同実験でトップクォークの発見に貢献したほか、高エネルギー加速器研究機構での国際共同実験等を通じた「B中間子系におけるCP対称の破れの発見」やニュートリノ振動の研究で知られる。
答える人:船守美穂 准教授(国立情報学研究所)
ふなもり・みほ。国立情報学研究所 情報社会相関研究系准教授。中学時代をドイツで過ごす。1991年東京大学理学部地球物理学科卒、1993年同研究科修士課程修了。(株) 三菱総合研究所 研究員、文部科学省大臣官房国際課国際協力政策室調査員、政策研究大学院大学助教授、東京大学の国際連携本部、評価支援室、教育企画室のIR担当特任准教授等を経て、2013年より現職。また2016年からはオープンサイエンス基盤研究センター准教授 (政策・連携担当)を務める。同センターウェブサイトにて海外大学事情「mihoチャネル」を執筆・発信中。
オープンサイエンスへの必然的な流れ
高等教育や大学経営を専門とする、国立情報学研究所オープンサイエンス基盤研究センターの船守美穂准教授は、オープンサイエンスは基本的には、「象牙の塔であった大学が、社会に開かれていく文脈」だと言う。「高等教育研究の世界的権威であるマーチン・トロウは、1973年にすでに大学が「エリート」から「マス」、さらに「ユニバーサル」へ移行すると予見していました。高等教育に多くの人々が加わってある段階を越えると大衆化し、大学教育が社会に開かれていった流れがあるわけですね。日本でも大学進学率が50%を越える時代を迎えています」。
高等教育のマス化の一方で、科学者自身の「社会の中の科学とは何か」についての意識も、時代につれて変化してきた。船守准教授によれば、変革の契機のひとつは1999年の世界科学者会議であるという。「この会議で、知とは専門家だけのものではなく、社会や一般の方に役に立つものでなければならないという視点が打ち出されたことは、エポックを拓いたと思います」。このような動きも、現在のオープンサイエンスの潮流へのもうひとつの源となっているのだそうだ。
船守准教授は言う。「研究費は税金として国民からもらったものだから、説明責任があるし、社会にとって意味のあるものを返さなければいけない。しかしオープン化が実際に進んでいくためには、それだけではなく、デジタル化やインターネットの発達といったインフラが整ってきたことが大きいと思います」。社会の変化に加え、オープン化を実現する技術的な手段が現実に揃ってきたことで、流れが一気に加速した──私たちは、そんな現在に生きているのだ。
技術が研ぎ澄まされてこそ、オープンにできる
相原副学長によれば、オープンサイエンスの進展を支える技術には、「データ記録装置容量、コンピュータの処理速度、それから高速な学術情報ネットワークSINET(通信網)」などがあるという。
しかし当然のことながら、研究データは一般に「難しい」。そこで望遠鏡などの自然観測データは、取得から一定期間の後、データを整形し、解析に使えるソフトウェアなども含めて公開されるようになっている。また東京大学では、例えばサマースクールのような機会を設けて、使い方を教えながらデータを公開してきたという。
素粒子物理学が専門の東京大学相原博昭副学長は、このような経緯も踏まえて「いろんな技術が研ぎ澄まされていかないと、社会の中で活用の広がりを生むような、本当の意味でオープンは実現できない」という。オープン化に伴って高速情報処理、データの保全、個人情報の保護(匿名化)などさまざまな技術的な課題があるからだ。
プロジェクトを推進するもうひとつの原動力は、社会の要請に加え、オープンにすることで科学の進歩がスピードアップするという視点だ。かつて、データは取得した研究者個人のものであり、一般に、少なくとも論文が発表されるまでは公開されなかった。しかし「もともと素粒子物理では、たくさんのデータを解析しなければならないため、グループで研究する形態が日常的に起こっていた」と相原副学長は振り返る。「科学を加速させるには、データから、誰が発見してもいいじゃないか、という考え方もあるわけです。ただし、その見つけた人だけが論文の著者になるわけではなくて、その道筋上にいる人たちのそれぞれの貢献を、ちゃんと記していくしくみを作っていく」のだという。
研究データが公開されれば、機械学習・AIによるモデリング、シミュレーションなど、さまざまな利用が考えられる。「重要なのは、量的に非常に大きなデータにアクセスできるようになることで、質的な転換が起こることです。科学の発展の核にインフォマティクスが入ってきて、データを集めて単に便利だというのではなくて、それらを組み合わせることで発見がある。つまり現代のビッグデータはこれまでと違う、本質的な変化なんですね。新しいサイエンスを作るいろんな可能性が、もう圧倒的に大きい、まさにデジタルレボリューションが起きているわけです」。
本当にビッグデータを活用できる時代が来た
相原副学長は言う。「データ活用型社会創成プラットフォームは、データを集めて1つのテーブル上に乗せ、アプリも含めて使える形でユーザに提供します。ユーザーから見てうまく組み合わせられるよう、技術的な仕様をきちんと整えようというのがポイント」なのだそうだ。「例えば、東京大学は地理データを元にした3次元の日本の空間情報を持っているのですが、これを人の移動などの他のデータとつなげるとさまざまな応用が考えられます」。
「例えばインフルエンザなどの感染症の拡大を防ぐという課題に対して、お医者さんは、手元には患者さんの病気カルテがある一方で、患者さんがどこをどう動いたかという地理的なデータや交通データが欲しいわけですね。この2つのデータを組み合わせることによって、どこに注意すれば予防できるかを予測できるからです。そこで、このようなデータを簡単に見つけて、フォーマットなどの問題を気にしなくても利用できるようなしくみを考えています。地理上の人の動きは、まさに経済活動そのものですから他にもさまざまな利用が考えられますし、災害やその予防にも役立つでしょう」。
その他、水と気候の大規模データ、各種リアルタイムデータなども準備が進められているほか、人文・社会の研究課題を問い合わせると「こういうデータがありますよ」と推薦してくれる「課題持ち込み型」マッチングも開発中だという。「データに付属するメタデータというものを工夫して、ユーザの背後で、他の分野の人も分かるような特徴を表したり、分類ができたりするしくみを検討しています。ユーザがやりたいことを入力すると、機械が内部のデータに問い合わせて“このデータとこのデータを組み合わせると解決しませんか?”と回答してくる……といったイメージです」。
データの適正な公開と循環を考える
データ活用型社会創成プラットフォームは、SDGsの実現を目指して東大総長直下に設置された「未来社会協創推進本部(Future Society Initiative, 2017-)」の活動の一環として行われている。このため「未来をよくするということは軽視できないんですね。デジタルレボリューションに関わる環境問題やエネルギー問題なども真剣に取り組まなければなりません」と相原副学長は言う。プラットフォームの運用は2021年度開始予定とのことだ。
「ドイツの主要な学術機関含まれている連合(Allianz der Wissenschaftlicheorganisationen)から研究データ会議に関して『 Research data at your fingertips』という提言が出ています。それによると、新任教員が着任したらすべてのデータが使えるような環境になっていて、自分のデータもきちんと管理ができて、公開したいときにはすぐ公開できるような環境をつくるのが、これからの学術機関の務めである、と。そして、そういう機関には優秀な研究者が集まるため、卓越した研究機関になれる……といったことを述べているんですね。ところが、それを実現している機関がどこにもないと思っていたら、ここにあったんだ! という気持ちです」。(船守)
「いや、これは東大だけではなく、全国のためなんですね。実際、プラットフォームの仕様詳細は、他の大学や研究機関と連携して決めていく計画です。また、そもそもわれわれはなぜデータを集めて自由に使えるようにするのか──それは社会をよくするためですよね。科学者はきっといいことが起こるだろうと思っているわけですけれども、一方で文系の先生方が常に一緒にチェックするといった体制も必要です」。(相原)
「先日、NISTEP(科学技術・学術政策研究所)のシンポジウムに出席したところ、10年後にどんな研究分野が伸びるかという科学技術予測が議論されていて、IT系の技術がいろいろ伸びるという報告があったのですが、それと同時に個人情報保護など、デジタル時代の法整備を検討すべきだというコメントが多かったのが印象的でした」。(船守)
「デジタルレボリューションが社会にとってよいように起こるためには、ビジネスや公共政策など社会のさまざまな部門が広く参加して、研究データがパブリックに使えるようになっていかなければなりません。そうしないと、サイエンスそのものが支えられない、発展しないというところへ戻ってしまいます。オープンデータが、もともと投じられた税金というリソースの最大活用になっている──そこがオープンサイエンス、オープンデータの本質ではないでしょうか」。(相原)
(聞き手:池谷瑠絵 写真:河野俊之、飯島雄二(コラム) 公開日:2020/02/10)
オープンサイエンスのドアを開こう。
インターネットの発達を背景に、学術と社会が緊密に連携して科学を発展させようという世界的な動きである、オープンサイエンス。国際的には、特に2013年のG8の科学技術大臣会合の共同宣言から各国・地域において取り組みが加速している。このインフラとなる学術基盤を集約的に開発・運営するセンターが、国立情報学研究所(NII)のオープンサイエンス基盤研究センター(RCOS)だ。
写真はそのメンバーの(ほぼ)全員。山地一禎センター長(NIIコンテンツ科学研究系教授、写真2列目左端)は、「これだけの多様なメンバーが集まって、一日中オープンサイエンスのことばかり考えている。研究者が心から使いたいと思う魅力的なサービスを、どんどん提供していく」という。
RCOSが研究開発・運用する研究データ基盤(システム)には、管理・公開・検索の3つがある。それぞれ「研究管理」を担う「GakuNin RDM」、大学や研究機関の論文・データ公開を支援する「WECO3」、知のつながりを構築し、データの利活用を促進するような検索機能を実現する「CiNii Research」の開発が進められている。また、基盤を開発する技術者や研究者だけではなく、ポリシー、ニーズ分析、広報普及担当など、幅広い人材が揃っているのもRCOSの特徴だ。今後の展開に、ぜひ注目したい。