AIモデルのための新しいデータ標準を作成。 New data standards created for AI models.
2022-11-10 アルゴンヌ国立研究所(ANL)
AIモデルをFAIRにすることによって、異なるグループのコンセプトを再利用することが容易になり、チーム間の相互交流を生み出すのに役立つ。FAIRのAIモデルを作成し共有することで、努力の重複を減らし、素晴らしい科学を可能にするためにこれらのモデルをどのように使用するかのベストプラクティスを共有することができる。
Huerta氏らは、多様なユーザーのニーズに応えるため、独自のデータ管理および高性能コンピューティングプラットフォームを組み合わせ、FAIRプロトコルを確立し、AIモデルの「FAIRらしさ」を定量化しました。研究者たちは、Materials Data Facilityと呼ばれるオンラインリポジトリで公開されているFAIRデータと、Data and Learning Hub for Scienceと呼ばれる別のオンラインリポジトリで公開されているFAIR AIモデル、さらにArgonne Leadership Computing Facility(ALCF)のAIおよびスーパーコンピューティングリソースをペアリングさせた。
このようにして、研究者たちは、さまざまなハードウェアとソフトウェアの橋渡しをするための計算フレームワークを構築し、プラットフォーム間で同様に実行でき、再現性のある結果をもたらすAIモデルを作成することができました。
このフレームワーク構築の鍵となるのが、研究者がノートパソコンから直接高性能コンピューティングリソースにアクセスできる「funcX」と「Globus」と呼ばれるプラットフォームです。FuncXとGlobusは、ハードウェアアーキテクチャの違いを超越するのに役立ちます」と、アルゴンヌのデータサイエンスと学習部門のディレクターである共著者イアン・フォスターは述べています。ある人があるコンピューティングアーキテクチャを使い、別の人が別のアーキテクチャを使っている場合、共通のAI言語を話す方法ができたことになります。これは、AIをより相互運用可能にするための大きな要素です。”
今回の研究では、アルゴンヌのAdvanced Photon Sourceの回折データを用いたAIモデルのデータセットを例として使用しました。計算には、ALCF AI TestbedのSambaNovaシステムとスーパーコンピュータThetaのNVIDIA GPU(グラフィック・プロセッシング・ユニット)が使用されました。
<関連情報>
- https://www.anl.gov/article/argonne-scientists-promote-fair-standards-for-managing-artificial-intelligence-models
- https://www.nature.com/articles/s41597-022-01712-9
加速高エネルギー回折顕微法への実用化を目指したAIモデルのFAIR原則 FAIR principles for AI models with a practical application for accelerated high energy diffraction microscopy
Nikil Ravi,Pranshu Chaturvedi,E. A. Huerta,Zhengchun Liu,Ryan Chard,Aristana Scourtas,K. J. Schmidt,Kyle Chard,Ben Blaiszik & Ian Foster
Nature Scientific Data Published:10 November 2022
DOI:https://doi.org/10.1038/s41597-022-01712-9
Abstract
A concise and measurable set of FAIR (Findable, Accessible, Interoperable and Reusable) principles for scientific data is transforming the state-of-practice for data management and stewardship, supporting and enabling discovery and innovation. Learning from this initiative, and acknowledging the impact of artificial intelligence (AI) in the practice of science and engineering, we introduce a set of practical, concise, and measurable FAIR principles for AI models. We showcase how to create and share FAIR data and AI models within a unified computational framework combining the following elements: the Advanced Photon Source at Argonne National Laboratory, the Materials Data Facility, the Data and Learning Hub for Science, and funcX, and the Argonne Leadership Computing Facility (ALCF), in particular the ThetaGPU supercomputer and the SambaNova DataScale® system at the ALCF AI Testbed. We describe how this domain-agnostic computational framework may be harnessed to enable autonomous AI-driven discovery.