ディープラーニングに潜む普遍法則を発見~ディープニューラルネットワークを支配する「物理」~

2025-07-19 東京大学

東京大学とアイシンの研究グループは、ディープニューラルネットワークの信号伝搬が、統計物理で知られる「吸収状態転移」と同様の法則に従うことを発見しました。ReLU関数などを用いたネットワークでは、信号が途中で消失する「吸収状態」に陥るかが、活性化関数や重み分散で決まるスケール因子κと層数Lの積(κL)に依存することが理論と実験から明らかになりました。この知見により、ディープラーニング設計を統一的に理解・最適化できる可能性が広がり、他分野との連携や応用も期待されます。

ディープラーニングに潜む普遍法則を発見~ディープニューラルネットワークを支配する「物理」~
森林火災(上)と、ディープニューラルネットワークにおける人工ニューロンの活動(下)の類似性。

<関連情報>

人工深層ニューラルネットワークにおける吸収相転移の普遍的スケーリング則 Universal scaling laws of absorbing phase transitions in artificial deep neural networks

Keiichi Tamai, Tsuyoshi Okubo, Truong Vinh Truong Duy, Naotake Natori, and Synge Todo
Physical Review Research  Published: 18 July, 2025
DOI: https://doi.org/10.1103/jp61-6sp2

Abstract

We demonstrate that conventional artificial deep neural networks operating near the phase boundary of the signal propagation dynamics—also known as the edge of chaos—exhibit universal scaling laws of absorbing phase transitions in nonequilibrium statistical mechanics. We exploit the fully deterministic nature of the propagation dynamics to elucidate an analogy between a signal collapse in the neural networks and an absorbing state (a state that the system can enter but cannot escape from). Our numerical results indicate that the multilayer perceptrons and the convolutional neural networks belong to the mean-field and the directed percolation universality classes, respectively. Also, the finite-size scaling is successfully applied, suggesting a potential connection to the depth-width trade-off in deep learning. Furthermore, our analysis of the training dynamics under the gradient descent reveals that hyperparameter tuning to the phase boundary is necessary but insufficient for achieving optimal generalization in deep networks. Remarkably, nonuniversal metric factors associated with the scaling laws are shown to play a significant role in concretizing the above observations. These findings highlight the usefulness of the notion of criticality for analyzing the behavior of artificial deep neural networks and offer new insights toward a unified understanding of the essential relationship between criticality and intelligence.

1601コンピュータ工学
ad
ad
Follow
ad
タイトルとURLをコピーしました