制御システムの最適化問題をディープニューラルネットワークで解く

2021-11-04

制約付き非線形システムの離散時間確率的最適制御問題への新たなアプローチを構築

制約付き非線形システムの離散時間確率的最適制御問題への新たなアプローチを構築

2021-11-04 国立情報学研究所,大阪大学,科学技術振興機構

情報・システム研究機構国立情報学研究所（ＮＩＩ、所長：喜連川優、東京都千代田区）の情報学プリンシプル研究系准教授岸田昌子と大阪大学大学院情報科学研究科（研究科長：村田正幸、大阪府吹田市）の准教授小蔵正輝らの研究グループは、一般的に解を求めることが難しいと言われている最適制御問題に対し、制御対象の数理モデルに基づくディープニューラルネットワーク（ＤＮＮ）を用いて、直感的かつ容易にアプローチする方法を構築しました。この研究は、科学技術振興機構（JST、理事長：濵口道成、東京都千代田区）の戦略的創造研究推進事業の「CREST ＡＩ集約的サイバーフィジカルシステムの形式的解析設計手法（研究代表者：京都大学准教授／ＮＩＩ客員准教授・末永幸平）」のもとで行われたものです。

非線形システムの最適制御問題は最も汎用的な形の連続最適化問題の１つですが、解析解を求めることは一般的には不可能で、これまでさまざまな数値解法が提案されてきました。しかし、既存のどの方法も非線形システムの最適制御問題の全ての形をカバーすることは難しく、また高度な数学知識が必要となることが大きなハードルとなっていました。

本研究では、特に解くことが難しい、「制約付きの非線形システムに対する離散時間確率的最適制御問題」を解く新たな方法として時相深層展開を提案しています。時相深層展開とは、動的システムの状態変化をディープニューラルネットワークの階層（レイヤー）に展開し、各レイヤーが各時刻での制御入力を決定するパラメーターを持つようにしたものです。このディープニューラルネットワークを訓練することで、適切な制御入力を求めることができるようになりました。本研究成果は、システム科学におけるさまざまな問題に広く適用可能なだけでなく、数学の専門家以外にも使いやすいものであるため、産業界のシステム制御において幅広い活用が期待されます。

本研究成果は、「ＩＥＴＣｏｎｔｒｏｌＴｈｅｏｒｙ＆Ａｐｐｌｉｃａｔｉｏｎｓ」に２０２１年１１月４日（木）（グリニッジ標準時）に発表されます。

本研究成果は、科学技術振興機構（ＪＳＴ）戦略的創造研究推進事業ＣＲＥＳＴ「数学・数理科学と情報科学の連携・融合による情報活用基盤の創出と社会課題解決に向けた展開」研究領域（研究総括：上田修功）における研究課題ＪＰＭＪＣＲ２０１２「ＡＩ集約的サイバーフィジカルシステムの形式的解析設計手法」（研究代表者：末永幸平）、ＪＳＰＳ科研費２１Ｈ０１３５２および大阪大学大学院情報科学研究科スタートアッププログラムの助成を受けたものです。

詳しい資料は≫