政府はAI学習データを通じチャットボット応答を形成し得る(Governments May Shape What AI Chatbots Say by Shaping the Data They Learn From)

2026-05-13 ニューヨーク大学(NYU)

ニューヨーク大学(NYU)の研究チームは、各国政府がAIチャットボットの学習データ環境を通じて、生成される回答内容に影響を与える可能性があると指摘した。研究では、大規模言語モデル(LLM)が学習するインターネット情報や公開データが、政府による検閲、情報統制、メディア政策などの影響を受けることで、AIの知識や価値観形成に偏りが生じ得ることを分析した。特に、特定の政治的立場や歴史認識が強く反映されたデータ環境では、チャットボット回答にも系統的な偏向が現れる可能性があるという。研究チームは、AIモデル自体だけでなく、学習データ生成環境の透明性と多様性確保が重要だと強調した。また、国際的なAIガバナンスやデータ監査体制の必要性も提言している。本研究は、生成AIの中立性、公平性、情報信頼性を考える上で重要な視点を提供する成果とされる。

政府はAI学習データを通じチャットボット応答を形成し得る(Governments May Shape What AI Chatbots Say by Shaping the Data They Learn From)
Photo credit: Andriy Onufriyenko/Getty Images

<関連情報>

国家メディア統制は大規模な言語モデルに影響を与える State media control influences large language models

Hannah Waight,Eddie Yang,Yin Yuan,Solomon Messing,Margaret E. Roberts,Brandon M. Stewart & Joshua A. Tucker
Nature  Published:13 May 2026
DOI:https://doi.org/10.1038/s41586-026-10506-7

Abstract

Millions of people around the world query large language models (LLMs) for information. Although several studies have compellingly documented the persuasive potential of these models1,2,3,4,5,6,7,8,9,10, there is limited evidence of who or what influences the models themselves, leading to a flurry of concerns about which companies and governments build and regulate the models. Here we show through six studies that government control of the media across the world already influences the output of LLMs via their training data. We use a cross-national audit to show that LLMs exhibit a stronger pro-government valence in the languages of countries with lower media freedom than in those with higher media freedom. This result is correlational, so to triangulate the specific mechanism of how state media control can influence LLMs, we develop a multi-part case study on China’s media. We demonstrate that media scripted and curated by the Chinese state appears in LLM training datasets. To evaluate the plausible effect of this inclusion, we use an open-weight model to show that additional pretraining on Chinese state-coordinated media generates more positive answers to prompts about Chinese political institutions and leaders. We link this phenomenon to commercial models through two audit studies demonstrating that prompting models in Chinese generates more positive responses about China’s institutions and leaders than do the same queries in English. The combination of influence and persuasive potential across languages suggests the troubling conclusion that states and powerful institutions have increased strategic incentives to leverage media control in the hopes of shaping LLM output.

1603情報システム・データ工学
ad
ad
Follow
ad
タイトルとURLをコピーしました