”色名の連想しやすさの起源:人間とAIの比較” ～自然言語処理ができるAIの心理研究プラットホームへの応用～

2022-10-28 基礎生物学研究所,玉川大学,京都工芸繊維大学

基礎生物学研究所神経生理学研究室の小松英彦研究員(玉川大学脳科学研究所兼任)、京都工芸繊維大学工芸科学部情報工学課程の前野彩実、基礎生物学研究所神経生理学研究室渡辺英治准教授(基礎生物学研究所超階層生物学センターAI解析室室長兼任)からなる研究グループは、ヒトとAIで色名の連想のしやすさを比較しました。近年高度に自然言語処理能力のあるAIが出現し、ヒトへの質問と同じ質問をAIに投げかけることが可能となり、このような自然言語を使っての直接比較が実現しました。実験の結果、AIが色名を連想するときの色名の頻度は、ヒトが色名を連想するときの色名の頻度と非常に似ていることが判明しました。この色名の頻度は、本やインターネット上に現れる色名の頻度とは異なるもので、高度に自然言語処理能力のあるAIが獲得した色の概念が、ヒトが持つ色の概念と類似していることを意味しています。ヒトは獲得した情報を脳内で概念化しており、関連深い概念同士は強くリンクされ、関連の遠い概念同士は弱くリンクされており、巨大な概念のネットワークが形成されています。このネットワークが、ヒトが世界について持っている知識であり、世界について認識する際のベースとなっているとされています。色名の連想のしやすさとは、このネットワークの構造に起因するものと私たちは考えています。すなわち、本研究の結果は、AIにもヒトと類似した概念のネットワークが獲得されていることを示唆しています。今後、自然言語処理ができるAIを心理研究のプラットホームとして活用することで、ヒトの認知のしくみの理解が深まるものと期待されます。本研究成果は2022年10月26日にi-Perception誌に掲載されました。

図1:自然言語処理ができるAIに様々な質問を投げかけることで、AIでもヒトと同様の心理テストが可能になる。このようなAIはヒトの知覚や認知についての理解を深めてくれると期待される。本研究では、図のような質問を実験者がAIに投げかけ(アルファベットa～zや数字0～9から連想する色)、その答えをヒトの結果と比較することで、ヒトの色名の連想しやすさの起源を探った。

【研究の背景】

「色の名前を一つ挙げてください?」と聞かれたら、あなたはどのような色を答えますか?これまでの研究で、ヒトが挙げやすい色名には偏りがあり、赤、青、緑、黄などの色名をよく答えることが示されています。興味深いことに、このような色の答えやすさの程度は、話し言葉や本・新聞などに印刷された膨大な言語の中で色名が使われる頻度とは一致しないことがわかっており、なぜ、ヒトが特定の色名を好んで答えるのかはよく分かっていません。

一方、近年人工知能(AI)技術が劇的に発展し、高度な自然言語処理能力を持つAIが現れています。これらの最先端のAIはヒトが作成したものと見分けがつかない自然な文を生成することができ、ヒトが質問すると自然な言葉で答えを返すことができます。このようなAIに上と同じ質問をしたら、どんな答えを返すでしょうか?このようなAIは、膨大な自然言語の文章を学習しており、世界についてのさまざまな情報を持ち、それにもとづいて言語を生成しています。単に文章に含まれる色名の頻度にもとづいて答えを返すのであれば、ヒトが答える色名の頻度とは一致しないことが予想されます。もし、膨大な文章にもとづいてヒトと共通な知識を持っているならば、回答する色名の頻度はヒトと一致する可能性があります。さらに、もしそのような結果が得られたならば、AIを利用して、新たな研究への道が開けるかもしれません。自然言語処理ができるAIにさまざまな質問を投げかけ、その答えを分析することで、ヒトが世界について持っている知識や世界についての認識の仕方を理解する新しい道が開けることが期待されます。

【研究の成果】

今回、研究グループは、現在最も高度な自然言語処理能力をもつAIの一つであるGPT-3(Open AI社が開発し公開している自然言語処理AIシステム)^(注1を用いて、以前Simnerらによって報告されたヒトの言語心理実験の論文^(注2と同様の方法で色名頻度を調べる実験を行いました。

Simnerらによる論文では、ある文字を見たり音を聞いた時などに、特定の色の感覚が生じる共感覚を持つ人(共感覚者^(注3)と、共感覚をもたない人(非共感覚者^(注3)の各グループについて、アルファベット(a〜x)から連想される基本色名^(注4を調べており、共感覚を持たない人であっても、アルファベットから連想される色には、多くのヒトに共通する傾向があることがわかっています。

研究グループは今回、ヒトを対象に行われたこの論文と同様の質問をAIに対して行いました。具体的には、GPT-3のチャット機能の画面で、各アルファベットや数字に対してどのような基本色名を連想するかを問いました(図1)。例えば「’a’というアルファベットに対して連想する色名を答えてください」と英語で入力して質問し、それに対してGPT-3が答えた基本色名を収集しました。各アルファベット及び数字に対して40～50回ずつ質問し、すべてのアルファベット、及び数字に対して得られた各基本色名の数を求め、頻度を計算しました。

その結果得られた各色名の頻度は、先の研究で報告されている非共感覚者の結果とよく一致していました。そして、その色名頻度は、AIが参照したであろうコーパス(膨大な言語のデータベース)に含まれる色名頻度とは大きく異なっていました。さらに、大規模なテキストデータベースを使い、色名と各アルファベットが同時に出現する頻度を直接的に解析したところ(Ngram解析^(注5)、AIから得られた色名の頻度とは大きく異なっていました。この結果は、少なくとも色に関しては、AIであるGPT-3が、ヒトと共通する知識を言語データベースから学習していることを示唆しています。

図2:GPT-3が答えた基本色名の頻度と、ヒトが答えた基本色名の頻度の相関を示すグラフ。GPT-3の答えはDavinciエンジン(GPT-3の中でも言語処理精度が最高のモデル)を使って得られたもの。ヒトの結果はSimnerらの論文(脚注)にもとづく。縦軸はピアソン相関係数(correlation coefficient、対数変換したデータにもとづいて計算)で、値が1に近づくほど相関が高くなる。横軸はGPT-3の制御パラメータの一つであるtemperature(出力する単語のランダム性を指定するパラメータ)。黄色の破線はGPT-3の出した答えとヒト非共感覚者(non-synaesthete)の答えとの相関を示し、青の点線はGPT-3の出した答えとヒト色字共感覚(synaesthete)の答えとの相関を示している。GPT-3の結果はヒト非共感覚者の結果と高い相関があった。

【今後の展望】

今回、色名の連想のしやすさについて、AIの回答結果とヒトの回答結果の類似性が示されました。ヒトは獲得した情報を脳内で概念化しており、関連深い概念同士は強くリンクされ、関連の遠い概念同士は弱くリンクされており、巨大な概念のネットワークが形成されています。このネットワークが、ヒトが世界について持っている知識であり、世界について認識する際のベースとなっているとされています。私たちは色名の連想のしやすさとは、このネットワークの構造に起因するものと考えています。すなわち、本研究の結果は、AIにもヒトと類似した概念のネットワークが獲得されていることを示唆しています。今後、自然言語処理ができるAIを心理研究のプラットホームとして活用することで、ヒトの認知のしくみの理解が深まるものと期待されます。

【語句説明】

注1)GPT-3 (generative pre-trained transformer 3)はOpen AI社が開発し公開している自然言語処理AIシステムの名称。3000億もの字句を含む大規模なデータセットを用いて学習を行っている。

注2)Simner, J., Ward, J., Lanz, M., Jansari, A., Noonan, K., Glover, L. & Oakley, D.A. (2005) Non-random associations of graphemes to colours in synaesthetic and non-synaesthetic populations. Cog Neuropsychol, 22, 1069-1085.

DOI: 10.1080/02643290500200122

注3)共感覚者とはある文字を見たり音を聞いた時などに、特定の色の感覚が生じる人を指す言葉。非共感覚者とは文字を見たり、音を聞いても色の感覚が生じない人のこと。脚注2の論文では、色‐字共感覚者と非共感覚者の両方についてアルファベットから連想される基本色名を調べている。

注4)基本色名とは多くの言語で類似の範囲の色を指すために使われる11の色名:黒、白、赤、青、黄、緑、橙、紫、茶色、ピンク、灰色

注5)Ngram解析:本実験では100万トークン以上から成る大規模なテキストデータベース(WikiText-103、英語Wikipedia全文)に対してNgram解析を行った(トークンは単語や記号など、文章を構成する最小単位)。Ngram解析では、文章を連続するN個のトークンに変換する。例えば、I am a catの2gramであれば、{I, am}{am, a}{a, cat}の三つの集合になる。続いて、それぞれの集合内で同時に二つの単語が出現する頻度を測定する。本論文では、1gram, 2gram, 3gram, 5gram, 10gramを測定した。1gramの場合は、単純に一つの単語が出現する頻度を測定することになる。

【発表雑誌】

雑誌名 i-Perception

掲載日 2022年10月26日

論文タイトル“Origin of the ease of association of color names: comparison between humans and AI”

著者: Hidehiko Komatsu, Ami Maeno, and Eiji Watanabe

DOI: 10.1177/20416695221131832

【研究グループ】

本研究は基礎生物学研究所神経生理学研究室の小松英彦研究員(玉川大学脳科学研究所兼任)と渡辺英治准教授(超階層生物学センターAI解析室兼任)、京都工芸繊維大学工芸科学部情報工学課程の前野彩実(基礎生物学研究所の体験入学イベントをきっかけに研究グループに参加)による成果です。

【研究サポート】

本研究は、文部科学省科学研究費助成事業などのサポートを受けて行われました。

【本研究に関するお問い合わせ先】

基礎生物学研究所神経生理学研究室准教授