お金の流れのネットワーク構造を世界で初めて解明

ad
ad

最先端ネットワーク科学の眼で銀行ビッグデータを見る

2021-05-27 理化学研究所,兵庫県立大学,滋賀大学

理化学研究所(理研)数理創造プログラムの青山秀明客員主管研究員、兵庫県立大学の藤原義久教授、滋賀大学の山口崇幸助教らの共同研究グループは、最新のビッグデータ・ネットワーク科学を用いて、地方銀行の企業口座間のお金の流れの構造を解明することに成功しました。

本研究成果は、地域経済のダイナミクスを明らかにしたことで、景気変動や経済危機の発生・伝搬の構造といったマクロ経済現象の理解につながり、経済の安定化に向けた政策提言に貢献すると期待できます。

今回、共同研究グループは、株式会社滋賀銀行から提供を受けた約3万の企業口座間における241万回、総額2.15兆円に上る膨大な銀行内入出金データについて、最新のビッグデータ・ネットワーク科学を用いて解析しました。その結果、企業間のお金の流れと取引のネットワークが「くるみ構造」であること、取引が集中する地域特性などを明らかにしました。このような厳重に保護されたビッグデータを詳細に分析した研究は世界初であり、大きな意義があると考えられます。

本研究は、科学雑誌『European Physical Journal (EPJ) Data Science』オンライン版(4月21日付:日本時間4月21日)に掲載されました。

背景

一国の経済活動は、政府、企業、家計といった経済主体が財やサービスを取引することによって営まれています。各経済主体間における種々の経済取引は多重ネットワークを形成していることから、経済の全体像や動態を緻密に捉えるには、そのネットワーク構造の解明が不可欠です。

近年、経済学や経済物理学の研究者たちは、経済主体の取引ネットワークの実データを、その時間変化も含めて取得し、ダイナミクスを明らかにする実証研究が重要であることを説いてきました。このような研究は、景気変動や経済危機の発生・伝搬の構造といったマクロ経済現象を解明するだけでなく、経済の安定化に向けた政策提言にもつながるものと期待されています。

しかし、取引ネットワークデータの多くはしかるべき機関に存在はしていても、プライバシーや利益保護などの観点から扱いが困難であったり、データが膨大であるがゆえに非常に高額であったりするため、研究者が容易に入手できません。

研究手法と成果

共同研究グループは株式会社滋賀銀行から、約3万の企業口座間における241万回、総額2.15兆円に上る銀行内入出金個票データ(2017年3月1日~2019年7月31日の883日間)の提供を受けました。このデータは、口座所有者名が削除され、口座番号から個人を特定できないように暗号化加工されています。そのため、解析対象のデータは、入出金の日時と金額、暗号化された送金元と送金先の口座番号、それらの口座の名義企業の所在地域から構成されています。また、データへのアクセスは特定の場所から厳格なアクセス制限下でのみ可能でした。

ネットワークではデータが点と線で表現され、点をノード、ノードをつなぐ線をエッジと呼びます。解析対象は、ノードを口座、エッジを口座間の全期間の入金と出金のそれぞれを合計とした有向ネットワーク[1]であり、エッジの数は約28万本に及びました。

ネットワークの大局的構造は、流れ込むINの部分、流れが循環するGSCC(巨大強連結成分)[2]の部分、流れ出るOUTの部分からなります。インターネットなどに関するネットワークの多くは、INとOUTがGSCCから左右に遠くまで広がる「蝶ネクタイ構造」であることが知られています。しかし解析の結果、今回のネットワークは、INとOUTに属するノードがGSCC内のノードと強くつながって殻状の構造をとる「くるみ構造」であることが明らかになりました(図1)。このくるみ構造は、2018年に青山秀明客員主管研究員らが日本企業の取引ネットワークにおいて初めて発見しました注1)。今回は企業間のお金の流れを対象としているため、企業の取引ネットワークと密接な関連があることから、くるみ構造になったと考えられます。

お金の流れのネットワーク構造を世界で初めて解明

図1 銀行口座のネットワークの大局的構造を示すくるみ構造

口座は他の口座とのつながり具合(入出金)により、流れ込むIN(4,508口座)、流れが循環するGSCC(巨大強連結成分,11,543口座)、流れ出ていくOUT(11,270口座)に分類される(合計27,321口座)。このネットワークは企業の取引ネットワークと同様に、INとOUTがGSCCをくるみの殻のように包み込む構造をしている。

注1)Abhijit Chakraborty, Y. Kichikawa, T. Iino, H. Iyetomi, H. Inoue, Y. Fujiwara, and H. Aoyama”Hierarchical Communities in the Walnut Structure of the Japanese Production Network”PLoS ONE 13(8), 2018


次に、ネットワークにおけるお金の流れの詳細を明らかにするため、流れを循環流と傾き流に分解するHodge分解[3]の手法を用いてデータを解析しました。これにより、それぞれのノード(口座)がお金の流れの上流・下流のどの位置にあるかがHodgeポテンシャルとして決定されます。また、流れに隠されたネットワークの大局的構造も見えてきます。

図2にくるみ構造のIN(青)、GSCC(黒)、OUT(赤)のHodgeポテンシャル[3]分布を示しました。これを見ると、OUT(生産者側)が他の部分と明確に分離されているのに対し、GSCCとIN(消費者側)は大きく重なっていることが分かります。これは企業の取引ネットワークには見られない分布であり、中間財の生産に主に従事する企業群(INに相当する)と、最終消費財(家庭で消費される財)の生産と販売に従事する企業群(それぞれGSCCとOUTに相当)がある程度分離していることを示しています。これは東京都や大阪府などの大都市圏と異なり、滋賀県に特有の産業構造である可能性が高く、他の都道府県での同様の研究の進展が待ち望まれます。

くるみ構造とHodgeポテンシャルの図

図2 くるみ構造とHodgeポテンシャル

くるみ構造のINに属するノードのHodgeポテンシャル分布を青線、同様にGSCCを黒線、OUTを赤線で描いたもの。TE(緑)はTendril(巻きひげ)と呼ばれ、それらには属さないノード群のことである。


さらに、企業間送金の地域的特性を明らかにするため、地域間の企業の送金の合計回数に対して非負値行列因子分解(NMF)[4]を適用して分析しました。この手法により、どの地域からどの地域への送金が主要なパターンであるのかを分解・抽出できます。滋賀県を中心とした送金データに対して、10種類のパターンに分解したところ、滋賀県の主要な地域内同士での送金と大津市から滋賀県の主要な地域への送金に分解できることが分かりました。

そのうちの一つのパターンを図3に示しました。送金元(左)、送金先(右)の企業の所在地を表しており、いずれも彦根市周辺であり、彦根市周辺で取引が行われる傾向にあることが分かります。他の地域内の送金パターンとしては、大津市周辺、草津市・栗東市周辺、近江八幡市周辺、米原市・長浜市周辺、東近江市周辺、守山市周辺、高島市周辺、湖南市・甲賀市周辺などが抽出されました。

送金元(左)と送金先(右)の彦根市周辺のパターンの図

図3 送金元(左)と送金先(右)の彦根市周辺のパターン

大津市を薄灰、彦根市を薄緑で描いた。送金元も送金先も彦根市周辺に存在し、彦根市周辺で取引されていることが分かる。

今後の期待

本研究では、銀行口座間の送受金というミクロで巨大なデータを分析することにより、そのネットワークがくるみ構造であるという全体像を明らかにし、地域間のお金の流れのパターンを検出しました。

くるみ構造からは各企業の”立ち位置”が分かることから、景気変動・経済危機に対する各企業への影響、ネットワーク全体への波及と収束の研究への道が開けました。

また、地域内における送金が主要なパターンであることは、その地域内で経済が回っていることを示唆しています。本研究成果を利用することで、地域内のお金の回り方を定量化し、地域の活性化に役立つ指標を作ることができます。

補足説明

1.有向ネットワーク
エッジが向きを持つネットワーク。本ネットワークではあるノード(本稿ではAとする)から別のノード(B)へ送金があると、それらをつなぐエッジはAからBへの向きを持つ。扱うデータによっては、エッジが向きを持たないネットワークとなる場合がある。例えば、映画俳優の共演ネットワークがその例である。そのようなネットワークは「無向ネットワーク」と呼ばれる。

2.GSCC(巨大強連結成分)
Giant Strongly Connected Componentの略。有向ネットワークにおいて、どのノードからもエッジの向きに従って進んで別のどのノードまで到達できる部分ネットワークをSCC(強連結成分)と呼ぶ。GSCCはその中で最大の部分ネットワークを指す。

3.Hodge分解、Hodgeポテンシャル
有向ネットワークにおいて、流れを「循環流」と「傾き流」とに分解する手法。これにより、各ノードのHodgeポテンシャルと呼ばれる高さが決定され、傾き流がこの高さの差となる。高さにより、ネットワーク全体で上流から下流への流れが決まり、各ノードの流れの中の位置が決定される。

4.非負値行列因子分解(NMF)
要素の値がいずれも0以上のN×M行列 Vを、要素の値がいずれも0以上のN×K行列 WとK×M行列 Hの積で近似する手法。KをNおよびMより小さくとれば、次元圧縮となる。本研究では、企業の所在地を地図上で東西と南北に100×100のメッシュで分割した10,000個の地域に分けた。地域 iに所在する企業から地域 jに所在する企業(i、jは1から10,000のインデックス)へ送金の合計回数を表す行列 g˜から行列 Vを定義した。N=M=10000であり、Kは10とした。NMFはnon-negative matrix factorizationの略。

共同研究グループ

理化学研究所 数理創造プログラム
客員主管研究員 青山 秀明(あおやま ひであき)
(経済産業研究所ファカルティフェロー)

兵庫県立大学大学院 情報科学研究科
教授 藤原 義久(ふじわら よしひさ)
准教授 井上 寛康(いのうえ ひろやす)

滋賀大学 データサイエンス教育研究センター
助教 山口 崇幸(やまぐち たかゆき)

滋賀大学大学院
データサイエンス研究科
准教授 田中 琢真(たなか たくま)

経済学研究科
准教授 菊池 健太郎(きくち けんたろう)

研究支援

本研究は、独立行政法人経済産業研究所(RIETI)におけるプロジェクト「COVID-19禍のもとのマクロ経済:その実証的分析と復興への道程(プロジェクトリーダー:青山秀明)」の成果の一部です。また、文部科学省ポスト京萌芽的課題「複数の社会経済現象の相互作用のモデル構築とその応用研究(多層マルチ時空間スケール社会・経済シミュレーション技術の研究・開発)」サブ課題「マクロ経済シミュレーション(研究代表者:藤原義久)」、日本学術振興会(JSPS)科学研究費補助金基盤研究(B) 17H02041「大規模な経済ネットワークシミュレーションに基づく経済システムの脆弱性のモデル化(研究代表者:藤原義久)」、同挑戦的研究(萌芽) 19K22032 「暗号通貨の大規模データに基づく決済ネットワークの構造とダイナミクスの数理的な解明(研究代表者:藤原義久)」、同基盤研究(B)20H0239「外生的ショックに対する大規模経済ネットワークの応答ダイナミクスの解明とその応用(研究代表者:藤原義久)」による支援を受けて行われました。

原論文情報

Yoshi Fujiwara, Hiroyasu Inoue, Takayuki Yamaguchi, Hideaki Aoyama, Takuma Tanaka & Kentaro Kikuchi, “Money flow network among firms’ accounts in a regional bank of Japan”, EPJ Data Science, 10.1140/epjds/s13688-021-00274-x

発表者

理化学研究所
数理創造プログラム
客員主管研究員 青山 秀明(あおやま ひであき)

兵庫県立大学大学院 情報科学研究科
教授 藤原 義久(ふじわら よしひさ)

滋賀大学 データサイエンス教育研究センター
助教 山口 崇幸(やまぐち たかゆき)

報道担当

理化学研究所 広報室 報道担当

1505金融工学
ad
ad
Follow
ad
タイトルとURLをコピーしました