AIモデルからの個人情報削除技術を開発(UCR pioneers way to remove private data from AI models)

2025-08-28 カリフォルニア大学リバーサイド校(UCR)

UCリバーサイドの研究チームは、AIモデルから個人情報や著作権データを効率的に削除する新技術「ソース不要認定忘却」を開発した。元の学習データがなくても、統計的に類似した代理データと制御ノイズを用いてモデルを再調整し、特定情報を復元できないようにする。従来の再学習に比べてコストやエネルギーを大幅に削減でき、性能も保持される点が特徴だ。この手法はGDPRやカリフォルニア消費者プライバシー法への準拠を支援し、著作権侵害訴訟などへの対応策としても有効とされる。医療データやメディア情報など機密性の高い分野での応用が期待される。

AIモデルからの個人情報削除技術を開発(UCR pioneers way to remove private data from AI models)

<関連情報>

ソースデータにアクセスできない場合の認証済みアンラーニング手法 A Certified Unlearning Approach without Access to Source Data

Umit Yigit Basaran, Sk Miraj Ahmed, Amit Roy-Chowdhury, Basak Guler
arXiv  Submitted on 6 Jun 2025
DOI:https://doi.org/10.48550/arXiv.2506.06486

Abstract

With the growing adoption of data privacy regulations, the ability to erase private or copyrighted information from trained models has become a crucial requirement. Traditional unlearning methods often assume access to the complete training dataset, which is unrealistic in scenarios where the source data is no longer available. To address this challenge, we propose a certified unlearning framework that enables effective data removal \final{without access to the original training data samples}. Our approach utilizes a surrogate dataset that approximates the statistical properties of the source data, allowing for controlled noise scaling based on the statistical distance between the two. \updated{While our theoretical guarantees assume knowledge of the exact statistical distance, practical implementations typically approximate this distance, resulting in potentially weaker but still meaningful privacy guarantees.} This ensures strong guarantees on the model’s behavior post-unlearning while maintaining its overall utility. We establish theoretical bounds, introduce practical noise calibration techniques, and validate our method through extensive experiments on both synthetic and real-world datasets. The results demonstrate the effectiveness and reliability of our approach in privacy-sensitive settings.

1603情報システム・データ工学
ad
ad
Follow
ad
タイトルとURLをコピーしました