材料研究の新展開:大規模計算データベースと実験データをつなぐスケーリング則を発見

ad

2025-06-05 統計数理研究所

統計数理研究所と三菱ケミカルの共同研究チームは、物質・材料研究機構と協力し、材料研究における「Sim2Real転移学習」のスケーリング則を発見しました。これは、物理シミュレーションによる大規模な計算物性データベースを活用し、限られた実験データでAIモデルを追加学習する手法で、データベースの規模拡大に伴い予測性能がべき乗則に従って向上することを示しています。この成果は、データ駆動型材料研究の効率化や戦略立案に貢献すると期待され、2025年5月24日付で『npj Computational Materials』誌に掲載されました。

材料研究の新展開:大規模計算データベースと実験データをつなぐスケーリング則を発見
図 1: Sim2Real転移学習スケーリング則を観測することに成功

<関連情報>

実世界予測のための計算材料データベースの拡張におけるSim2Real転移学習のスケーリング則 Scaling Law of Sim2Real transfer learning in expanding computational materials databases for real-world predictions

Shunya Minami,Yoshihiro Hayashi,Stephen Wu,Kenji Fukumizu,Hiroki Sugisawa,Masashi Ishii,Isao Kuwajima,Kazuya Shiratori & Ryo Yoshida
npj Computational Materials  Published:24 May 2025
DOI:https://doi.org/10.1038/s41524-025-01606-5

Abstract

To address the challenge of limited experimental materials data, extensive physical property databases are being developed based on high-throughput computational experiments, such as molecular dynamics simulations. Previous studies have shown that fine-tuning a predictor pretrained on a computational database to a real system can result in models with outstanding generalization capabilities compared to learning from scratch. This study demonstrates the scaling law of simulation-to-real (Sim2Real) transfer learning for several machine learning tasks in materials science. Case studies of three prediction tasks for polymers and inorganic materials reveal that the prediction error on real systems decreases according to a power-law as the size of the computational data increases. Observing the scaling behavior offers various insights for database development, such as determining the sample size necessary to achieve a desired performance, identifying equivalent sample sizes for physical and computational experiments, and guiding the design of data production protocols for downstream real-world tasks.

0101機械設計
ad
ad
Follow
ad
タイトルとURLをコピーしました