衛星観測値から地上の降水量を推定する機械学習手法の開発～回帰と分類のマルチタスク推論によって12.6%の精度向上を達成～

2023-04-06 東京大学

○発表のポイント：
◆人工衛星に搭載された「マイクロ波放射計」の観測値を利用し、地上の降水量を推定する新たな機械学習手法を提案した。
◆降水強度と降水有無の同時推定タスクをモデルに明示的に組み込むことで、手法の精度向上を達成した。
◆既存の機械学習手法は「データ駆動型」が中心だが、提案手法により物理的なメカニズムをモデルに組み込むことが期待できる。物理的な理解と機械学習の融合により、さらなる精度向上や「データ駆動型」モデルの課題解消が期待できる。

マルチタスク学習を用いた衛星降水量推定

○発表概要：
東京大学生産技術研究所の金炯俊特任准教授と、東京大学大学院工学系研究科修士課程の坂内匠大学院生らは、人工衛星に搭載された「マイクロ波放射計（注1）」の観測値を利用して地上の降水量を推定する、新たな機械学習手法を提案し、既存の方法と比べて12.6%の精度向上を達成しました。
これまでも、多くの機械学習手法が提案されてきましたが、データ駆動型モデル（注2）であり、大量の訓練データが必要・物理的な整合性が担保されない・ブラックボックスモデル（注3）などの課題に悩まされてきました。そこで本研究では、衛星降水量推定における知識を明示的に組み込むことで、モデル内の相互依存的な知識交換を実現しました。具体的には、マルチタスク学習（注4）という深層学習の手法を用いることで、降水有無を識別する分類モデルと降水強度を推定する回帰モデルを統合し、同時学習させました。
本研究で提案した機械学習モデルには、今回組み込んだメカニズム以外にも様々な物理メカニズムを組み込むことが可能です。例えば、雨や雪、霙など降水種類の分類や、対流性や層状性といった降水をもたらす雲種類の分類を組み込むことで、今後、さらに推定の精度が向上することが期待できます。

○発表内容：
降水量の正確な把握は、地球の水循環の理解や水資源、災害時対応のために重要です。全球の降水量測定には衛星観測が唯一の手段であり、2014年にNASA (National Aeronautics and Space Administration)とJAXA (Japan Aerospace Exploration Agency)が主導して開始した全球降水観測計画（Global Precipitation Measurement, GPM）が重要な役割を担っています。全球降水観測計画の降水量推定に向けたアルゴリズムには様々な手法が提案されており、昨今は機械学習を用いた手法が数多く提案されています。しかしこれらの既存手法はデータ駆動型モデルであり、衛星観測から降水量を推定するタスクに関する知識は考慮されていません。そこで本研究では、衛星降水量推定に関する理解をモデルに明示的に組み込むことで、モデル内で相互依存的な知識の交換を実現し、降水量推定精度を向上させる手法を提案しました。
本研究では、全球降水観測計画に搭載されているマイクロ波放射計から、地上降水量を推定するための機械学習手法を提案します。モデルはConvolutional neural network (CNN)（注5）と全結合ネットワーク（注6）を用いて降水量を出力するモデルを設計しています。このモデルに対して、マルチタスク学習という深層学習の手法を用いることで、降水強度の分類モデルと降水強度の推定モデルを統合し、同時学習するモデルを提案しました。マルチタスク学習は画像処理や自然言語処理の領域ではその有効性が確認されている手法で、本研究ではそれを衛星降水量推定に応用しています。応用にあたって、気象分野で用いられる閾値から降水の強さを「降水なし」「弱い雨」「中程度の雨」「強い雨」と定義して、それらを分類するモデルを降水量推定の関連タスクとして定義しました。また機械学習の誤差を考慮した評価を行うために、本研究ではモデルを多数回、独立学習させ、その平均と分散を考慮して結果評価する実験（アンサンブル実験）を採用しました（図1）。実験の結果、提案モデルは従来の深層学習モデルより、降水量推定では12.6% (Mean Absolute Error, MAE)、降雨有無分類では37.4% (Critical Success Index)の改善率を達成しました。また、既存の降水量推定データとの比較においても提案モデルは全般的により良い精度を実現しているとともに、バイアスの少ない降水量推定を実現できていることが確認されました。

図1：アンサンブル実験（Single-taskとTwo-taskの比較）
降水量推定の精度を二乗平均平方根誤差 (RMSE)（注7）、平均絶対値誤差 (MAE)（注8）、相関係数 (CC)（注9）の3指標で評価。全データ（All）に加えて、降水量強度別（Weak: 0.1-1.0 mm/h、 Moderate: 1.0-10.0 mm/h、 Heavy: >10 mm/h）で評価を実施。多数回の実験結果のヒストグラムが示されており、降水強度ごとの改善度合いがばらつきも含めて表現されている。

降水量推定と降水有無分類を同時学習することで精度向上に繋がった理由として、衛星のマイクロ波放射計に対する両タスクの背後にある物理的なメカニズムが一貫しており、同時学習によりモデル内で知識共有が働いたことが要因と考えられます。このことから、雨や雪、霙など降水種類の分類や、降水をもたらす雲種類の分類も物理的に関連している現象のため、これらを同時学習することでも精度向上に繋がる可能性があると考えています。
本研究では降水強度と降水分類の物理的な整合性に着目したモデル提案を行いましたが、本手法は様々な物理的な降水過程をモデル内で表現することへの拡張が可能であり、今後、気象学や雲微物理学（注10）との融合によるさらなるモデル精度の向上が期待できます。そして物理的な理解と機械学習の融合はデータ駆動型モデルの課題（大量の訓練データが必要・物理的な整合性が担保されない・ブラックボックスモデル）の解消に繋がります。その点で、本研究は今後の機械学習を用いた衛星降水量推定における新たな可能性を示していると考えられます。

○発表者：
東京大学
生産技術研究所
金炯俊（特任准教授）<韓国科学技術院（准教授）>

大学院工学系研究科社会基盤学専攻
坂内匠（修士課程）

京都先端科学大学工学部
内海信幸（特任准教授）

○論文情報：
〈雑誌〉　Geophysical Research Letters
〈題名〉　Multi-Task Learning for Simultaneous Retrievals of Passive Microwave Precipitation　Estimates and Rain/No-Rain Classification
〈著者〉　Takumi Bannai, Haoyang Xu, Nobuyuki Utsumi, Eunho Koo, Keming Lu, and Hyungjun Kim*

○研究助成：
本研究は、科研費「国際共同研究加速基金(国際共同研究強化(B))（課題番号：18KK0117）」、
科研費「基盤研究（B）（課題番号：21H01442）」、科研費「学術変革領域研究（A）（課題番号：21H05178）」、「JST戦略的国際科学技術協力推進事業Belmont Forum」、「JAXA第3回地球観測研究公募」「the National Research Foundation of Korea (NRF) grant Funded by the Korea Government (MSIT) (2021H1D3A2A03097768)」の支援により実施されました。

○用語解説：
（注1）マイクロ波放射計
マイクロ波放射計は物体が放出する電磁波（マイクロ波）を観測します。降水量推定においては雨粒から放射されているマイクロ波の放射強度を測定し、その測定値から降水量を推定します。

（注2）データ駆動型モデル
データ駆動型モデルとは、大量のデータから自動的にパターンを認識し、モデル構築するアプローチを指します。データ駆動型モデルは、人間の主観的な判断や先入観を排除でき、手作業で設計することが難しい複雑なパターンをモデル化することができます。

（注3）ブラックボックスモデル
ブラックボックスモデルとは、入力と出力の値は分かっているが、内部の仕組みやメカニズムが不明瞭なモデルのことを指します。データ量が膨大で複雑な問題を解決する場合、ブラックボックスモデルは高い精度を示すことがありますが、モデルの説明可能性が低く、予測結果に対する理解や信頼性が低下する可能性があるため、社会実装の際の問題になります。

（注4）マルチタスク学習
マルチタスク学習は単一のモデルで複数のタスク（問題）を解く深層学習の手法です。関連する複数のタスクで同時学習させることで、タスク間の共通要素を学習し、モデルの汎化性能が向上するとされています。

（注5）Convolutional neural network (CNN)
CNNは画像の特徴量抽出に利用される深層学習アルゴリズムの一種です。画像の局所的なパターン（エッジ、テクスチャ、形状など）の抽出に利用され、フィルターと呼ばれる小さな行列で畳み込むことで、入力画像を高次元空間の特徴量に変換します。

（注6）全結合ネットワーク
全結合ネットワークは古典的なニューラルネットワークの一種で、一つの層にある全てのユニットが前の層の全てのユニットと接続されています。CNNで抽出した特徴量を全結合ネットワークに入力することで、回帰や分類のアウトプットを出力します。

（注7）二乗平均平方根誤差 (RMSE)
二乗平均平方根誤差（Root Mean Squared Error, RMSE）とは、予測値と真値の誤差を表す指標の一つです。RMSEは、平均値からの偏差を2乗したものの平均値を平方根で計算することで求められます。RMSEが小さいほど、予測の精度が高いことを示します。

（注8）平均絶対値誤差 (MAE)
平均絶対値誤差（Mean Absolute Error, MAE）とは、予測値と真値の誤差を表す指標の一つです。MAEは、予測値と真値の差を絶対値で計算し、その平均値を求めることで求められます。MAEが小さいほど、予測の精度が高いことを示します。

（注9）相関係数 (CC)
相関係数（Correlation Coefficient, CC）とは、2つの変数の間の線形な関係性を評価する指標の一つです。相関係数は、-1から1までの値を取り、1に近いほど正の相関が強く、-1に近いほど負の相関が強く、0に近いほど相関が弱い、と判断されます。

（注10）雲微物理学
雲微物理学とは、大気中の雲の微小な粒子や物理的プロセスについて研究する学問分野のことです。雲微物理学においては、雲の構成要素である水滴、氷晶、降雪粒子などの微小粒子の発生、成長、蒸発、凝結、衝突などの物理的な挙動を研究します。これらの微小粒子の挙動は、雲の発生や消滅、降水の形態や量に影響を与えます。

○問い合わせ先：
東京大学生産技術研究所
特任准教授　金炯俊（きむひょんじゅん）

月	火	水	木	金	土	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30