制約付き非線形システムの離散時間確率的最適制御問題への新たなアプローチを構築
2021-11-04 国立情報学研究所,大阪大学,科学技術振興機構
情報・システム研究機構 国立情報学研究所(NII、所長:喜連川 優、東京都千代田区)の情報学プリンシプル研究系 准教授 岸田 昌子と大阪大学 大学院情報科学研究科(研究科長:村田 正幸、大阪府吹田市)の准教授 小蔵 正輝らの研究グループは、一般的に解を求めることが難しいと言われている最適制御問題に対し、制御対象の数理モデルに基づくディープニューラルネットワーク(DNN)を用いて、直感的かつ容易にアプローチする方法を構築しました。この研究は、科学技術振興機構(JST、理事長:濵口 道成、東京都千代田区)の戦略的創造研究推進事業の「CREST AI集約的サイバーフィジカルシステムの形式的解析設計手法(研究代表者:京都大学 准教授/NII 客員准教授・末永 幸平)」のもとで行われたものです。
非線形システムの最適制御問題は最も汎用的な形の連続最適化問題の1つですが、解析解を求めることは一般的には不可能で、これまでさまざまな数値解法が提案されてきました。しかし、既存のどの方法も非線形システムの最適制御問題の全ての形をカバーすることは難しく、また高度な数学知識が必要となることが大きなハードルとなっていました。
本研究では、特に解くことが難しい、「制約付きの非線形システムに対する離散時間確率的最適制御問題」を解く新たな方法として時相深層展開を提案しています。時相深層展開とは、動的システムの状態変化をディープニューラルネットワークの階層(レイヤー)に展開し、各レイヤーが各時刻での制御入力を決定するパラメーターを持つようにしたものです。このディープニューラルネットワークを訓練することで、適切な制御入力を求めることができるようになりました。本研究成果は、システム科学におけるさまざまな問題に広く適用可能なだけでなく、数学の専門家以外にも使いやすいものであるため、産業界のシステム制御において幅広い活用が期待されます。
本研究成果は、「IET Control Theory & Applications」に2021年11月4日(木)(グリニッジ標準時)に発表されます。
本研究成果は、科学技術振興機構(JST) 戦略的創造研究推進事業 CREST「数学・数理科学と情報科学の連携・融合による情報活用基盤の創出と社会課題解決に向けた展開」研究領域(研究総括:上田 修功)における研究課題JPMJCR2012「AI集約的サイバーフィジカルシステムの形式的解析設計手法」(研究代表者:末永 幸平)、JSPS科研費 21H01352および大阪大学 大学院情報科学研究科 スタートアッププログラムの助成を受けたものです。
<論文タイトル>
- “Temporal Deep Unfolding for Constrained Nonlinear Stochastic Optimal Control”
- DOI:10.1049/cth2.12207
<お問い合わせ先>
<JST事業に関すること>
舘澤 博子(タテサワ ヒロコ)
科学技術振興機構 戦略研究推進部 ICTグループ
<報道担当>
情報・システム研究機構 国立情報学研究所 総務部 企画課 広報チーム
大阪大学 大学院情報科学研究科 庶務係
科学技術振興機構 広報課