日本語精度が高い130億パラメータの大規模言語モデル(LLM)を開発 ~お客様の業種・業務に合わせたカスタムLLMを2024年春から提供開始~ | テック・アイ技術情報研究所

日本語精度が高い130億パラメータの大規模言語モデル(LLM)を開発 ~お客様の業種・業務に合わせたカスタムLLMを2024年春から提供開始~

ad

2024-01-31 株式会社リコー

株式会社リコー(社長執行役員:大山 晃)は、日本企業の業務での活用を目的に、企業ごとのカスタマイズを容易に行える130億パラメータの大規模言語モデル*1(LLM)を開発しました。日本語と英語での学習において、その学習データの比率を工夫することで、日本語としての文法や回答が正確で日本語精度の高い、日本企業が持つ情報資産の活用に適したモデルを実現しました。ベンチマークツールを用いた性能検証*2の結果、日本語で利用できる130億パラメータを持つ日本語LLMにおいて、2024年1月4日現在で最も優れた結果を確認しました。

労働人口減少や高齢化を背景に、AIを活用した生産性向上や付加価値の高い働き方が企業成長の課題となっており、その課題解決の手段として、多くの企業がAIの業務活用に注目しています。しかし、AIを実際の業務に適用するためには、企業固有の用語や言い回しなどを含む大量のテキストデータをLLMに学習させ、その企業独自のAIモデル(カスタムLLM)を作成する必要があります。このたびリコーが開発したLLMは、米Meta Platforms社が提供する「LLM Llama2-13B」をベースに、日本語と英語のオープンコーパス*3を追加学習させて開発したものです。①学習に利用するコーパスの選定 ②誤記や重複の修正などのデータクレンジング ③学習データの順序や割合を最適化するカリキュラム学習 など、リコー独自の学習上の工夫が組み込まれていることが特徴です。学習の結果、特にNLI(自然言語推論能力)において高性能となっています。日本語LLMの性能評価で広く使われている日本語ベンチマークツール(llm-jp-eval)を用いた他LLMモデルとの性能比較*2では、評価スコアの平均値が最も高く、優れた性能を確認することができました。

日本語精度が高い130億パラメータの大規模言語モデル(LLM)を開発 ~お客様の業種・業務に合わせたカスタムLLMを2024年春から提供開始~
日本語ベンチマークツール(llm-jp-eval)における他モデルとの比較結果*2(リコーは最下段)

学習能力が高い本LLMに企業独自の情報や知識を取り入れることで、お客様ごとの業種・業務に合わせた高精度なAIモデル(カスタムLLM)を、短期間で容易に構築することが可能になります。カスタムLLMをお客様の業務で活用し、業務文書の要約や質問応答の作業をAIに置き換えることで、業務のワークフローを最適化し、業務効率化を実現します。

2024年春から、カスタムLLMをクラウド環境でお客様へ提供開始します。まずは日本国内のお客様より提供を開始し、今後海外のお客様への提供も目指します。

LLMは、パラメータ数が多いほどより多くの情報を処理でき、学習能力が高まる一方、より大きな計算リソースが必要になるうえ、学習や運用の難易度が上がり、開発難易度が高くなります。本モデルは「AWS™ LLM開発支援プログラム」によるサポート提供のもと、AWS Trainiumアクセラレーターを搭載したAmazon Elastic Compute Cloud Trn1インスタンスを利用することで、従来手法の開発と比較し45%のコスト低減および12%の開発期間短縮を実現することができました。さらに、お客様向けカスタムLLMを開発する際にも、効率的に開発することができるため、お客様へより安価・短納期でのご提供が可能です。

なお、今回のLLM開発とその手法は2024年3月11日から開催される言語処理学会*4第30回年次大会において論文発表する予定です。

リコーは、お客様に寄り添い、業種業務に合わせて利用できるAIサービスの提供により、 お客様が取り組むオフィス/現場のデジタルトランスフォーメーション(DX)を支援してまいります。


*1 人間が話したり書いたりする言葉(自然言語)に存在する曖昧性やゆらぎを、文章の中で離れた単語間の関係までを把握し「文脈」を考慮した処理を可能にしているのが特徴。「自然文の質問への回答」や「文書の要約」といった処理を人間並みの精度で実行でき、学習も容易にできる技術。

*2 2024年1月4日時点の評価結果。公開されている日本語LLMのうち130億パラメータかつトークナイザを日本語適応している事前学習モデルとの比較。
MC、NLI、QA、RC は、下記カテゴリー内の平均値。Avg.はその4カテゴリー平均値の平均値。
MC (Multi-Choice QA:多肢選択質問応答):jcommonsenseqa
NLI(Natural Language Inference:自然言語推論):jamp、janli、jnli、jsem、jsick
QA(Question Answering:質問応答):jemhopqa、niilc
RC(Reading Comprehension:読解):jsquad
*3 自然言語の文章や使い方を大規模に収集し、一般公開されているデータセット。

*4 自然言語処理(NLP)分野では最大の学会です。学会発表するNLP2024は、言語処理学会の年次大会です。

1602ソフトウェア工学
ad
ad
Follow
ad
タイトルとURLをコピーしました