リコー、自社開発のセーフガードモデルを無償公開LLMの入出力に含まれる有害情報を検出し、生成AIの安全な利活用に貢献

2026-05-20 株式会社リコー

リコーは、LLMの入出力に含まれる有害情報を検出・遮断する自社開発のセーフガードモデル「Llama-Ricoh-SafeGuard-20260520」を無償公開しました。Meta系日本語LLM「Llama-3.1-Swallow-8B-Instruct-v0.5」を基盤に、独自の量子化技術で小型・軽量化し、暴力、犯罪、差別、プライバシー侵害など14分類の有害情報を高精度に判定します。ユーザー入力と生成AI出力の双方を監視するガードレールLLMとして機能し、安全で信頼性の高い生成AI運用を支援します。日本では実用的な日本語ガードレールLLMが少ない中、オープン公開により安全な生成AI活用の普及を促進する狙いがあります。GENIAC参画などで培ったリコーのLLM開発基盤を活用した成果であり、企業向けオンプレミスAI運用への応用も期待されます。

<関連情報>

1602ソフトウェア工学
ad
ad
Follow
ad
タイトルとURLをコピーしました