神経修飾機構を模した自己制御機能の導入によるレザバーコンピューティングの高性能化

2024-01-22

2024-01-22 IRCN東京大学国際高等研究所

[ 発表者 ]

酒見悠介　 (千葉工業大学数理工学研究センター上席研究員／東京大学国際高等研究所ニューロインテリジェンス国際研究機構（WPI-IRCN）連携研究者)
信川創　 (千葉工業大学情報科学部教授）
松木俊貴　(防衛大学校情報工学科助教)
森江隆　(九州工業大学大学院生命体工学研究科特任教授・名誉教授）
合原一幸　(東京大学特別教授・名誉教授／東京大学国際高等研究所ニューロインテリジェンス国際研究機構（WPI-IRCN）副機構長・主任研究者／千葉工業大学数理工学研究センター主席研究員）

[ 概要 ]

酒見悠介 (千葉工大)、信川創 (千葉工大)、松木俊貴（防衛大）、森江隆 (九工大)、合原一幸 (東大)は、次世代型人工知能であるレザバーコンピューティング（ＲＣ）^※１に、脳の神経修飾機構を模した自己制御機能を付与する拡張を行いました。この新しい人工知能モデルは自己制御型レザバーコンピューティング（Self-modulated RC: SM-RC）と名付けられました。数値シミュレーションにより、SM-RCは、従来のRCでは不可能であった、注意機構やカオスダイナミクスの活用が実現できることを示しました。さらに、SM-RCは、従来のRCと比べて、極めて高い時系列予測性能を持つことを明らかにしました。SM-RCは高い学習性能と、電力効率の鍵となる物理実装性^※２とを両立しているため、エッジAIへの応用が期待されます。この成果は、2024年１月12日に査読付き国際学術雑誌「Communications Physics」で公開されました。

■背景

深層学習を中心とした人工知能（ＡＩ）技術は社会を大きく変革しつつありますが、多くのＡＩは莫大な電力を必要とするために、センサーや、ロボットへの搭載は未だ困難です。ＡＩに必要な電力を大きく削減することができれば、ロボットなどのよりユーザーに近いところでのAI動作（エッジＡＩ）が可能になり、社会の隅々までＡＩによる自動化・高性能化の恩恵をもたらすことができます。
レザバーコンピューティング（ＲＣ）^※１は、入力層、レザバー層、出力層で構成される、再帰型ニューラルネットワーク（ＲＮＮ）の一種であり、時系列データに対するエッジＡＩを実現するＡＩモデルとして期待されています。レザバー層は、ニューラルネットワーク以外にも多様な力学系で構築が可能なため、物理実装^※２と呼ばれる新しい仕組みによるハードウェア上での情報処理が可能です。この物理実装は、CPUやGPUなどの既存の計算機よりも極めて高いエネルギー効率性を示すため、エッジAIを実現するための鍵と考えられています。一方で、ＲＣは学習される重みが出力層のみに限定されるため、最先端のRNNモデルに比べて学習性能が劣る欠点を持ちます。すなわち、エッジＡＩの実現のために、高いエネルギー効率を実現する物実装性と、高い学習性能とを両立するＡＩモデルが求められています。

■ 内容

本研究では、ＲＣの学習性能の向上を目指し、RCに神経修飾機構を模した自己制御機能を付与する拡張を行い、RCの学習性能を飛躍的に向上させることに成功しました。この新しいモデルを自己制御型レザバーコンピューティング（Sel-modulated RC: SM-RC）と名付けました。
RCは、入力信号を高次元空間であるレザバー層に伝達させることで、出力層のみの学習に限定しても高い学習性能を示します。一方で、入力信号のレザバー層への伝達の仕方は、入力信号のダイナミクスに依らず一定であるため、レザバー層内でのダイナミクスは多様性に欠けます。実際、RCにおいては、入力強度とレザバー層の内部結合強度（スペクトル半径）は、タスクに応じて精密に調整する必要があります。そこで、私たちは、入力に依存して情報処理を大きく変化させる機構である注意機構に着目しました。注意機構は、深層学習においても重要視されており、また神経科学おいては、神経修飾機構が注意機構に大きく関わっていると考えられています。神経修飾機構とは、ある脳領域のニューロンが神経修飾物質を別の脳領域に投射することで、その領域の神経活動を変調する機構です。私たちは、この神経修飾機構を模した機構をRCに導入し、SM-RCを考案しました。図１に示すように、SM-RCは、入力ゲートとレザバーゲートを持ち、入力強度とスペクトル半径を、それぞれ変調することができます。これらのゲートはレザバー層からの出力によって動的に制御されるため、入力信号に依存した適応的な複雑なダイナミクスをレザバー層内に引き起こすことができます。
従来式のRCとSM-RCの動作の違いを明確に示すために、単純アテンションタスクを用いて、学習結果の比較を行いました（図２）。単純アテンションタスクでは、入力信号をレザバー層内に保持しているときに、入力ノイズがレザバー層をかき乱してしまうため、従来のRCでは解くことが困難でした。一方で、SM-RCでは、入力信号を保持しているときは、入力ゲートを閉じることでノイズの影響を抑え、さらにスペクトル半径を大きくすることで情報の保持を実現しています。さらに、興味深いことに、この情報保持の間は、レザバー層はカオス状態にあることがわかりました。従来のRCはカオス状態では学習が困難であることが知られていますが、　　SM-RCではカオス状態も有効に活用していることがわかります。このように、SM-RCは、従来のRCでは実現不可能な複雑なダイナミクスをレザバー層内に引き起こすことで、学習性能を向上させていることがわかりました。
SM-RCは、一般的な時系列予測ベンチマークの一つであるカオス時系列予測タスクにおいても高い予測性能を持つことがわかりました。図３にカオス時系列予測タスクに関して、他のRNNモデルと性能比較した結果を載せています。RCの学習性能はレザバー層のサイズを大きくすることで向上することが知られていますが、SM-RCは10分の1のサイズのレザバー層で、従来式のRCと同様の予測性能を示すことがわかりました（図３(a)）。また同様に、RCを含むRNNモデルは学習パラメータ数を増やすと予測性能が向上することが知られています。SM-RCは、同じ学習パラメータ数において、従来式のRCよりも学習性能が高く、さらに、LSTM、GRUなどの最先端のRNNモデルと同様の学習性能を持つことがわかりました(図３(b)。
SM-RCは高い学習性能を持つだけではなく、従来式のRCと同様物理実装性にも優れていると考えられます。それはSM-RCでは、一つのゲート機構によって、ネットワーク全体を均一的に動的制御するからです。この特徴により、精密に制御ができないような力学系においても物理実装を可能にします。一方で、LSTMやGRUは、一つ一つのニューロンに対して個別のゲート機構が存在します。そのため、精密な制御が必要となり物理実装が困難になります。なお、SM-RCは出力層以外も学習するので、RCが持っていた高速な学習性は失われています。以上の性質から、表１に示すように、SM-RCはRCと最先端のRNNモデルの中間的な役割を有すると考えられます。そして、これらのモデルの中で、唯一SM-RCが、高いエネルギー効率を実現する物理実装性と高い学習性能とを両立していることがわかります。
本研究では、数値シミュレーションによるSM-RCの学習性能の検討にとどまっており、社会実装のためには、SM-RCの物理実装まで踏み込む必要があります。今後は、SM-RCの具体的な物理実装形態やハードウェア上での学習の仕組みなど、ハードウェア化に関する研究を進めてまいります。

※１) レザバーコンピューティング (ＲＣ)
入力層、レザバー層、出力層で構成される再帰型ニューラルネットワーク（ＲＮＮ）の一種。典型的にはレザバー層はランダム結合のＲＮＮで実装されるが、様々な力学系を用いることが可能です。この性質により、様々な形態での物理実装が進められています。また、レザバー層と出力層の間の結合のみを学習するため高速な学習が可能です。

※２) 物理実装
物理実装は、半導体、フォトニクス、スピントロニクスなどを用いることで計算機システムを構築することであり、デジタルシステムとは異なり、物理法則を直接的に演算の基礎とする特徴があります。物理実装は、非常に高速かつ高いエネルギー効率を示しますが、その複雑性のため大規模システムの構築が困難です。RCは様々な力学系を用いることが可能なため、物理実装に適していると考えられています。

■ 論文情報

雑誌名:　 Communications Physics
論文題目: 　Learning Reservoir Dynamics with Temporal Self-Modulation
著者: 　Yusuke Sakemi、Sou Nobukawa、Toshitaka Matsuki、Takashi Morie、and Kazuyuki Aihara
URL: 　 https://www.nature.com/articles/s42005-023-01500-w
DOI: 　10.1038/s42005-023-01500-w
発表日時: 　2024年1月12日

■ 謝辞

本研究の一部は、JSTさきがけJPMJPR22C5、セコム科学技術振興財団、JST Moonshot R&D Grant Number JPMJMS2021、AMED under Grant Number JP23dm0307009、the International Research Center for Neurointelligence (WPI-IRCN) at The University of Tokyo Institutes for Advanced Study (UTIAS)、JSPS KAKENHI Grant Number JP20H05921から助成を受けて行われました。

＜お問い合わせ先＞

【本研究内容に関する問い合わせ先】
千葉工業大学　数理工学研究センター　上席研究員
酒見　悠介
【取材・大学広報関連に関する問い合わせ先】
千葉工業大学　入試広報部
大橋　慶子

■ 添付資料

図1 従来型のRCと提案したSM-RCの構造の比較
従来型のレザバーコンピューティング (RC)は、入力層、レザバー層、出力層で構成されており、出力層のみを学習します。レザバー層は典型的にはランダム結合した再帰型ニューラルネットワーク(RNN)を用いますが、様々な力学系を用いることが可能です。提案した自己制御型RC（SM-RC）は新たに入力ゲートgⁱⁿ、レザバーゲートg^resを有しており、それぞれ、入力信号、レザバー層のスペクトル半径を制御することができます。SM-RCでは、出力層に加えて、レザバー層から、各ゲートへの重みを学習します。

図2 単純アテンションタスクにおける従来型RCとSM-RCの動作比較
単純アテンションタスクは、ノイズ中に存在するパルス信号を入力とし、一定時間後にパルスを出力するタスクです。左図は従来型レザバーコンピューティング（RC）の学習結果であり、上から、入力信号、レザバー層、出力層 (青実線：出力信号、橙破線：教師信号)、鋭敏性 (青実線：平均値、橙破線：最大値)の時間発展を表します。右図は考案した自己制御型RC（SM-RC)の学習結果であり、上から、入力信号、レザバー層、出力層(青実線：出力信号、橙破線：教師信号)、ゲート(青実線：入力ゲート、橙破線：スペクトル半径)、鋭敏性 (青実線：平均値、橙破線：最大値)の時間発展を表します。SM-RCでは、ノイズ強度を3倍にして、より困難なタスクになっていますが、出力層において、教師信号(橙破線)と、出力信号(青実線)がほぼ一致していることがわかります。鋭敏性に関しては、RCの場合は、常に負の値をとりますが、SM-RCの場合には一部の正の値をとります。これは、SM-RCにおけるレザバー層がカオス状態をとっていることを示しています。

図3 カオス時系列予測の学習性能比較
(a) 従来型レザバーコンピューティング (RC)の予測誤差を、レザバー層のサイズを横軸としてプロットしています。また、入力されるカオス時系列に様々なノイズσⁱⁿが存在する場合を重ねてプロットしています。SM-RCのレザバー層サイズは100に固定しており、予測精度は横線で表されています。(b) 様々な再帰型ニューラルネットワーク(RNN)モデルについて、学習パラメータを横軸として予測誤差をプロットした結果を示しています。

表1 各種RNNモデルの比較

月	火	水	木	金	土	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31