オープンサイエンス向け大規模AI推論サービスを開始(Argonne launches first large-scale AI inference service for open science)

2026-05-26 アルゴンヌ国立研究所(ANL)

Argonne National Laboratory は、オープンサイエンス向けとして世界初の大規模AI推論サービスを開始した。米国エネルギー省傘下の同研究所は、高性能計算資源と大規模言語モデルを統合し、研究者が科学データ解析やシミュレーション支援を効率的に行える基盤を構築した。新サービスはスーパーコンピュータ「Polaris」などを活用し、材料科学、気候研究、生命科学、エネルギー研究など多分野でのAI利用を支援する。従来、研究者ごとに必要だったAIモデル運用や計算環境構築を共通基盤化することで、大規模推論を迅速かつ低コストで利用可能にした点が特徴である。研究コミュニティ全体で共有可能なAI基盤を整備することで、科学研究の加速とオープンサイエンス推進を目指す。今後は研究機関間連携や大規模データ駆動型研究の拡大が期待されている。

オープンサイエンス向け大規模AI推論サービスを開始(Argonne launches first large-scale AI inference service for open science)
Argonne’s inference service is powered by ALCF systems including Sophia (left) and Metis (right). (Image by Argonne National Laboratory.)

<関連情報>

FIRST: 科学AIモデルアクセス向け連合型推論リソーススケジューリングツールキット FIRST: Federated Inference Resource Scheduling Toolkit for Scientific AI Model Access

Aditya Tanikanti, Benoit Côté, Yanfei Guo, Le Chen, Nickolaus Saint, Ryan Chard, + 6
SC Workshops ’25: Proceedings of the SC ’25 Workshops of the International Conference for High Performance Computing  Published: 15 November 2025
DOI:https://doi.org/10.1145/3731599.3767346

Abstract

We present the Federated Inference Resource Scheduling Toolkit (FIRST), a framework enabling Inference-as-a-Service across distributed High-Performance Computing (HPC) clusters. FIRST provides cloud-like access to diverse AI models, like Large Language Models (LLMs), on existing HPC infrastructure. Leveraging Globus Auth and Globus Compute, the system allows researchers to run parallel inference workloads via an OpenAI-compliant API on private, secure environments. This cluster-agnostic API allows requests to be distributed across federated clusters, targeting numerous hosted models. FIRST supports multiple inference backends (e.g., vLLM), auto-scales resources, maintains “hot” nodes for low-latency execution, and offers both high-throughput batch and interactive modes. The framework addresses the growing demand for private, secure, and scalable AI inference in scientific workflows, allowing researchers to generate billions of tokens daily on-premises without relying on commercial cloud infrastructure.

1603情報システム・データ工学
ad
ad
Follow
ad
タイトルとURLをコピーしました