大型AIモデルにおける言語処理の神経単位を特定(A Step Towards Understanding Machine Intelligence the Human Way)

ad

2025-05-12 スイス連邦工科大学ローザンヌ校(EPFL)

スイス連邦工科大学ローザンヌ校(EPFL)の研究チームは、大規模言語モデル(LLM)内に、人間の脳の言語ネットワークに類似した「言語選択的ユニット」が存在することを発見しました。これらのユニットは、実際の文章に対して活性化し、ランダムな単語列には反応しない特性を持ちます。さらに、これらのユニットを無効化すると、モデルの言語生成能力が著しく低下し、意味のあるテキストを生成できなくなることが確認されました。この結果から、LLMの言語処理能力は、全体の約1%未満のユニットに依存している可能性が示唆されます。研究チームは、人間の脳の理論的思考や複数の課題処理に関与するネットワークに対応するユニットもLLM内に存在するかを調査し、一部のモデルではそのような特化ユニットが確認されましたが、他のモデルでは見られませんでした。この研究は、LLMの内部構造と機能の理解を深め、人間の認知機能との比較研究に新たな道を開くものです。

<関連情報>

LLM言語ネットワーク 神経科学的アプローチによるタスク関連ユニットの同定 The LLM Language Network: A Neuroscientific Approach for Identifying Causally Task-Relevant Units

Badr AlKhamissi, Greta Tuckute, Antoine Bosselut, Martin Schrimpf
arXive  last revised 13 Feb 2025 (this version, v2)
DOI:https://doi.org/10.48550/arXiv.2411.02280

大型AIモデルにおける言語処理の神経単位を特定(A Step Towards Understanding Machine Intelligence the Human Way)

Abstract

Large language models (LLMs) exhibit remarkable capabilities on not just language tasks, but also various tasks that are not linguistic in nature, such as logical reasoning and social inference. In the human brain, neuroscience has identified a core language system that selectively and causally supports language processing. We here ask whether similar specialization for language emerges in LLMs. We identify language-selective units within 18 popular LLMs, using the same localization approach that is used in neuroscience. We then establish the causal role of these units by demonstrating that ablating LLM language-selective units — but not random units — leads to drastic deficits in language tasks. Correspondingly, language-selective LLM units are more aligned to brain recordings from the human language system than random units. Finally, we investigate whether our localization method extends to other cognitive domains: while we find specialized networks in some LLMs for reasoning and social capabilities, there are substantial differences among models. These findings provide functional and causal evidence for specialization in large language models, and highlight parallels with the functional organization in the brain.

1600情報工学一般
ad
ad
Follow
ad
タイトルとURLをコピーしました