2023-06-08 筑波大学
(Image by ART STOCK CREATIVE/Shutterstock)
AIによる解析の精度を上げるためには分布の偏りのない十分な数のデータを集めることが重要です。このとき、複数の機関に分散したデータを集めるためには、個人情報やノウハウなどの秘匿したい情報に配慮して安全に統合解析するAI技術が必要となります。特に個人情報を含む場合、共有するデータと元データに「容易照合性」があるとその利用において制約があることが課題でした。
本研究では、複数の企業・自治体・病院等がそれぞれ保有する個人情報データに対して、個人を特定可能なデータと容易照合できない抽象化データのみを共有し統合的に解析する、より安全な人工知能技術「容易照合不可データコラボレーション技術」を開発しました。この研究では、データ間の容易照合性に対する数学的定義を導入し、検討する枠組みを導入しました。その上で、元データと容易に照合できない抽象化データのみ共有する統合解析アルゴリズムを提案しました。これにより、個人情報を含むデータ解析においてより多くのデータを活用することが可能となり、AIの解析精度の大幅な向上が実現されると考えられます。
具体的な応用例として、複数の医療機関が有する検査・投薬データの統合解析による疾患予測や疾病リスク因子推定や、複数の教育機関の学生データの統合解析による教育効果増進などが挙げられます。また、将来的にはさまざまな機関にある質の高い個人情報データを、元データを保護したまま収集してAIによる分析を行う新たなプラットフォームを支える技術としても期待できます。
PDF資料
研究代表者
筑波大学 人工知能科学センター
櫻井 鉄也 センター長
掲載論文
- 【題名】
- Non-readily identifiable data collaboration analysis for multiple datasets including personal information
(個人情報を含む複数データのための容易照合不可データコラボレーション解析) - 【掲載誌】
- Information Fusion
- 【DOI】
- 10.1016/j.inffus.2023.101826