フーリエ変換により、ディープニューラルネットワークが複雑な物理現象を学習する仕組みが明らかになった(Fourier transformations reveal how deep neural network learns complex physics)


科学的AIの「ブラックボックス」は、200年前の手法には勝てない​​​​​​​。 Scientific AI’s ‘black box’ is no match for 200-year-old method

2023-02-13 ライス大学

illustration of the substantial differences in the scale of features a deep learning neural network is shown during training and the features it learns to recognize
Rice University researchers trained a form of artificial intelligence called a deep learning neural network to recognize complex flows of air or water and predict how flows will change over time. This visual illustrates the substantial differences in the scale of features the model is shown during training (top) and the features it learns to recognize (bottom) to make its predictions. (Image courtesy of P. Hassanzadeh/Rice University)

◆ライス大学の機械工学研究者によるこの発見は、米国科学アカデミー紀要の姉妹誌であるPNAS Nexusに発表されたオープンアクセス研究に記載されています。
◆”ディープニューラルネットワークは悪名高く理解が難しく、しばしば “ブラックボックス “とみなされます。「これは、ディープニューラルネットワークを科学的な用途に使用する際の大きな懸念事項の1つです。もう1つは、汎化性です。これらのネットワークは、訓練されたシステムとは異なるシステムに対しては機能しないのです。
◆”これの素晴らしいところは、ニューラルネットワークが魔法を使っていないことです “とハッサンザデは言いました。とハッサンザデは言います。「何もおかしなことはしていません。物理学者や数学者がやろうとしていたことを、実際にやっているのです」。もちろん、ニューラルネットの力がなければ、これらのフィルタを正しく組み合わせる方法はわかりませんでした。でも、物理学者にこの研究のことを話すと、とても喜ばれます。なぜなら、彼らは「ああ! こういうのがあるんだ」と、わかってくれるからです。これがニューラルネットワークが学習したものなんだ。なるほどね』って。


データ駆動型乱流モデリングにおける伝達学習の物理的説明 Explaining the physics of transfer learning in data-driven turbulence modeling

Adam Subel, Yifei Guan, Ashesh Chattopadhyay, Pedram Hassanzadeh
PNAS Nexus  Published:23 January 2023


Transfer learning (TL), which enables neural networks (NNs) to generalize out-of-distribution via targeted re-training, is becoming a powerful tool in scientific machine learning (ML) applications such as weather/climate prediction and turbulence modeling. Effective TL requires knowing 1) how to re-train NNs? and 2) what physics are learned during TL? Here, we present novel analyses and a framework addressing (1)-(2) for a broad range of multi-scale, nonlinear, dynamical systems. Our approach combines spectral (e.g., Fourier) analyses of such systems with spectral analyses of convolutional NNs, revealing physical connections between the systems and what the NN learns (a combination of low-, high-, band-pass filters and Gabor filters). Integrating these analyses, we introduce a general framework that identifies the best re-training procedure for a given problem based on physics and NN theory. As test case, we explain the physics of TL in subgrid-scale modeling of several setups of 2D turbulence. Furthermore, these analyses show that in these cases, the shallowest convolution layers are the best to re-train, which is consistent with our physics-guided framework but is against the common wisdom guiding TL in the ML literature. Our work provides a new avenue for optimal and explainable TL, and a step toward fully explainable NNs, for wide-ranging applications in science and engineering, such as climate change modeling.

