AIも 「Us 」対 「Them 」のバイアスに悩まされる(“Us” vs. “Them” Biases Plague AI, Too)

ad

2024-12-12 ニューヨーク大学 (NYU)

ニューヨーク大学の研究者は、AIモデルが人間と同様に「内集団」と「外集団」のバイアスを持つ可能性があることを明らかにしました。このバイアスは、AIがトレーニングデータから学習する際に、特定のグループに対する偏見を取り込むことで生じます。その結果、AIシステムは特定の集団に有利または不利な判断を下す可能性があり、社会的な不平等を助長するリスクがあります。この問題を解決するためには、トレーニングデータの多様性を確保し、アルゴリズムの設計段階でバイアスを検出・修正する取り組みが必要です。

<関連情報>

生成言語モデルが社会的アイデンティティ・バイアスを示す Generative language models exhibit social identity biases

Tiancheng Hu,Yara Kyrychenko,Steve Rathje,Nigel Collier,Sander van der Linden & Jon Roozenbeek
Nature Computational Science  Published:12 December 2024
DOI:https://doi.org/10.1038/s43588-024-00741-1

AIも 「Us 」対 「Them 」のバイアスに悩まされる(“Us” vs. “Them” Biases Plague AI, Too)

Abstract

Social identity biases, particularly the tendency to favor one’s own group (ingroup solidarity) and derogate other groups (outgroup hostility), are deeply rooted in human psychology and social behavior. However, it is unknown if such biases are also present in artificial intelligence systems. Here we show that large language models (LLMs) exhibit patterns of social identity bias, similarly to humans. By administering sentence completion prompts to 77 different LLMs (for instance, ‘We are…’), we demonstrate that nearly all base models and some instruction-tuned and preference-tuned models display clear ingroup favoritism and outgroup derogation. These biases manifest both in controlled experimental settings and in naturalistic human–LLM conversations. However, we find that careful curation of training data and specialized fine-tuning can substantially reduce bias levels. These findings have important implications for developing more equitable artificial intelligence systems and highlight the urgent need to understand how human–LLM interactions might reinforce existing social biases.

1600情報工学一般
ad
ad
Follow
ad
タイトルとURLをコピーしました