人工知能によるアイヌ語の自動音声認識・合成に成功（AINU語AI）

2020-10-15

2020-10-15 京都大学

河原達也情報学研究科教授、松浦孝平同修士課程学生、三村正人同研究員らの研究グループは、消滅危機言語に認定されているアイヌ語の音声を自動で認識し、合成する人工知能（AI）を研究・開発しました。

北海道のアイヌ文化は多くが口頭で継承されてきましたが、アイヌ語は2009年にUNESCOにより「極めて深刻な」消滅危機言語に認定される事態となっています。以前から口頭伝承を録音・記録する活動が様々に行われてきたが、その書き起こし・アーカイブ化には膨大な手間とアイヌ語の知識を必要とするため、多くが未整備のままでした。

本研究グループは、アイヌ民族博物館と平取町立二風谷アイヌ文化博物館から提供いただいた計10名・約40時間の民話（ウエペケㇾ）の音声データを用いて、音声認識の単位・構成・学習法について様々な検討を行いました。その結果、音節（子音-母音または子音-母音-子音）を単位として用いることで、深層学習に基づくEnd-to-Endモデルにより、94％の音素認識率・80％の単語認識率が実現できることを示しました。また、前記の音声データのうち1人当たり10時間以上ある話者について、同モデルにより音声合成を構築しました。

本研究により、アイヌ語のアーカイブ構築の効率化への寄与が期待されます。実際に、アイヌ民族博物館において音声と書き起こし同期のための対応付けに活用され、1時間のデータに対して、人手で1日要する作業がほぼ完全に自動化できました。

本研究成果は、2020年9月9日の日本音響学会で報告され、10月12日に公表されました。