【株式会社リコー】リコー、「GENIAC」第3期においてリーズニング性能を備えたマルチモーダル大規模言語モデルを開発

～複雑な図表を含む企業ドキュメントの読解に対応、軽量モデルを本日より無償公開～

株式会社リコー（社長執行役員：大山晃）は、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構（NEDO）が実施する、国内における生成AIの開発力強化を目的としたプロジェクト「GENIAC（Generative AI Accelerator Challenge）*1」第3期において、図表を含む多様なドキュメントを、高精度に読み取ることができる、リーズニング性能*2を備えたマルチモーダル大規模言語モデル（以下、リーズニングLMM）の基本モデル「Qwen3-VL-Ricoh-32B-20260227」の開発を完了したことをお知らせします。本モデルは、多段推論を通じて複雑なドキュメントを理解できる点が特徴です。

また、本モデル開発で適用した技術を活用した軽量モデル「Qwen3-VL-Ricoh-8B-20260227」を、本日から無償公開します。さらに、リーズニング性能の評価に特化したリコー独自開発のベンチマークツール*3についても、今後公開する予定です。

【公開先】

https://huggingface.co/ricoh-ai/Qwen-3-VL-Ricoh-8B-20260227

1．取り組みの背景と社会課題

LMM（Large Multimodal Model）とは、テキスト・画像・音声・動画など複数の種類のデータを同時に処理できるAI技術です。スクリーンショットからのテキスト要約や、図表を含む質問への回答など、さまざまなタスクにおいて高い性能を発揮することから、幅広いデータ形式を扱えるAIとして期待が高まっています。

企業内には、請求書や領収書などのトランザクションデータ、事業戦略や計画などの経営資料、サービスマニュアルや社内で定めた技術標準、品質管理基準など、多様なドキュメントが蓄積されています。これらのドキュメントには、テキストだけでなく、図や表組、画像なども含まれており、企業内での効率的な利用や新たな価値・イノベーションを生み出すための活用が期待されています。一方で、「テキスト検索では意図した結果が得られない」、「検索機能のみでは文書の十分な活用が難しい」といった課題も指摘されています。

さらに近年では、労働力の減少に対応した効率的な働き方や、ベテラン社員の退職に伴う技能伝承、外国人労働者の増加に伴う文書の多言語化といった経営課題への対応が求められています。こうした背景から、AIを活用して企業内の知識を、効率的に活用するニーズが高まっています。

リコーは、2024年8月から実施されたGENIACの第2期において、700億パラメータのLMMを開発し、その基本モデルおよび独自開発のベンチマークツールを無償公開しました。また、2026年1月には、中国のアリババクラウドが開発・提供する大規模言語モデル（LLM）ファミリーの「Qwen2.5-VL-32B-Instruct」をベースとした320億パラメータのコンパクトなLMMを開発しました。

2．今回の成果

第3期では、「Qwen3-VL-32B-Instruct*4」をベースに、多段推論によって複雑なドキュメントを高精度に理解できるリーズニングLMMの基本モデル「Qwen3-VL-Ricoh-32B-20260227」を開発しました。本モデルでは、強化学習*5やカリキュラム学習*6といった学習手法の工夫により、複数ページにまたがる図表を関連付けて理解し、読解難易度の高い質問に対しても、高精度な回答を生成することが可能になりました。強化学習では、独自の報酬関数を設定することで、学習効率を高める一方、過学習を抑制しています。また、カリキュラム学習では、難易度設定と学習ペースの最適化を行いました。

これらの取り組みにより、「Gemini2.5-Pro」などの大型商用モデルと同等のベンチマーク結果を確認しています（2026年2月17日時点）。なお、本モデルのリーズニング性能を評価するため、リコーは独自のベンチマークツールを開発しており、今後公開する予定です。

さらに、日本企業での実務利用を想定し、思考プロセスの日本語化にも取り組みました。これにより、日本語文書の読み取り精度向上に加え、回答の判断根拠や前提条件を日本語で確認できるようになり、実務利用における信頼性を高めています。

【本モデルの性能面での特徴】

•

図表読解の深化: 強化学習やカリキュラム学習による推論プロセスの導入することで、複雑なドキュメントの読み間違いを大幅に低減。

•

論理思考力の向上: データの抽出に留まらず、読み取った数値に基づく計算や比較分析の精度が向上。

•

高信頼な回答生成: 思考プロセスを日本語化することで回答の根拠を明確化し、ビジネス実務における信頼性が向上。

3．企業での活用に向けて

セキュリティ、プライバシー、ガバナンスの観点から、オンプレミスや自社データセンターなどの社内専用環境でAIを利用したいと考える企業は多く、省リソースでAIを活用できる環境へのニーズが高まっています。リコーが開発した本モデルは、オンプレミス環境での導入が可能であり、企業の業種・業務に応じたファインチューニングにも対応しています。

また、企業内での活用を加速するためには、開発コストや運用コストの低減も重要な課題です。リコーは、モデルマージ*7技術の活用により、効率的な開発プロセスを確立し、プライベートモデルの提供に活用していきます。さらに、独自の画像トークン*8の圧縮技術を用いることで、高性能化に伴い増大する運用コストの低減にも取り組みます。

詳細は技術ページをご覧ください。

https://jp.ricoh.com/technology/ai/LLM#20260330

本モデルの具体的な適用例として、製造業のお客様からは、トラブル発生時に社内ドキュメントを高精度に参照することによる早期解決や、製品開発段階における設計図と要求仕様の適合確認などのニーズが寄せられており、今後実証実験を進めていく予定です。

ベンチマーク結果

リコーのLLM/LMMラインアップ（2026年3月30日時点）

4．今後の展開

　リコーはこれまで、多様なAIソリューションを通じて、企業の業務変革を支援してきました。特に、複合機やスキャナー、カメラなどのエッジデバイス開発で培った画像処理技術や、ドキュメントおよびワークフローマネジメントに関する長年の知見を活かしたドキュメントAIの開発に強みを持っています。

2025年12月には、企業内に蓄積されたノウハウや経験など、言語化されていない「暗黙知」を含む情報資産をAIで利活用する企業向けAIプラットフォーム「Hi.DEEN（ヒデン）*9」を発表しました。

また2026年3月には、AI・デジタル技術を軸にコンサルティング事業を展開する株式会社ライズ・コンサルティング・グループと、企業の経営課題解決を目的として、AX（AIトランスフォーメーション）の実現を支援する合弁会社設立に向けた基本合意書を締結しています。
リコーは、これら取り組みに加え、GENIACで得られた成果を広く社会に還元することで、日本企業の知の結晶ともいえるドキュメントの利活用を促進します。これにより、業務革新と付加価値の高い働き方を支援し、企業価値の向上に貢献してまいります。
　　　　　　　　　　　　　　

*1 GENIAC（ジーニアック/Generative AI Accelerator Challenge）：主に生成AIのコア技術である基盤モデルの開発に対する計算資源の提供や、データやAIの利活用に向けた実証調査の支援等を実施するプロジェクト。

*2リーズニング性能： LLMが単に情報を検索したりテキストを生成したりするだけでなく、複数のステップからなる論理的な思考プロセスを経て結論を導き出す性能。

*3　ベンチマークツールについて：視覚情報とテキスト情報の両方を参照する質問応答データセット JDocQAに加えて、日本企業の文書に特有な複雑な図表をテストデータの中心に据えた、リーズニング性を評価する手法も独自に開発し、2種類のベンチマークツールを活用して評価しました。

4　https://huggingface.co/Qwen/Qwen3-VL-32B-Instruct
5　強化学習: AIによる機械学習の一分野で、AIが環境と相互作用しながら最適な行動を学習する方法。AIが与えられた目標に対して、試行錯誤して得る報酬を最大化するため、最適な行動戦略を見つけ出すことが特徴。

*6　カリキュラム学習:　AIによる機械学習の一分野で、学習の順序を工夫した学習方法。

*7　モデルマージ：複数の学習済みのLLMモデルを組み合わせて、より性能の高いモデルを作る新たな方法のこと。GPUのような大規模な計算リソースが不要で、より手軽にモデル開発ができるとして、近年注目されています。

*8　画像トークン： LMMはテキストや図表のデータをトークンと呼ばれる符号に変換してから処理します。画像トークンとはこのうち図表を符号に直したものを指します。

*9　 Hi.DEEN: リコーが開発した、企業内に眠る「暗黙知」や「非構造化データ」を資産に変え、競争力の源泉となる「秘伝のタレ」へと昇華させるためのAI技術基盤。

■リコーのAI開発について

リコーは、1980年代にAI開発を開始し、2015年からは画像認識技術を活かした深層学習AIの開発を進め、外観検査や振動モニタリングなど、製造分野への適用を行ってきました。2021年からは自然言語処理技術を活用し、オフィス内の文書やコールセンターに寄せられた顧客の声（VOC）などを分析することで、業務効率化や顧客対応を支援する「仕事のAI」の提供を開始しました。

さらに、2022年からは大規模言語モデル（LLM）の研究・開発にもいち早く着手し、2023年3月にはリコー独自のLLMを発表。その後も、700億パラメータという大規模ながら、オンプレミス環境でも導入可能な日英中3言語対応のLLMを開発するなど、お客様のニーズに応じて提供可能なさまざまなAIの基盤開発を行っています。また、画像認識や自然言語処理に加え、音声認識AIの研究開発も推進し、音声対話機能を備えたAIエージェントの提供も開始しています。

■関連ニュース
リコーリコーとライズ・コンサルティング・グループ、AX実現を支援する合弁会社設立に向け基本合意

https://jp.ricoh.com/release/2026/0303_1

「Qwen2.5-VL-32B-Instruct」ベースのマルチモーダルLLMを開発
https://jp.ricoh.com/release/2026/0108_2

リコー、国産生成AI開発強化プロジェクト「GENIAC」第3期においてリーズニング性能を持つマルチモーダルLLMの開発開始
https://jp.ricoh.com/release/2025/0715_2
リコー、マルチモーダルLLMの基本モデルと評価環境を無償公開

https://prtimes.jp/main/html/rd/p/000000167.000043114.html

リコー、GENIACでマルチモーダルLLMの基本モデルを開発完了
https://jp.ricoh.com/release/2025/0610_1
リコーと損保ジャパン、マルチモーダルLLMの共同開発を開始
https://jp.ricoh.com/release/2025/0321_1

リコー、経済産業省の国内生成AI開発力強化プロジェクト「GENIAC」に採択

https://jp.ricoh.com/release/2024/1017_1

■関連リンク
技術ページ：“はたらく”を支えるリコーの大規模言語モデル（LLM）

https://jp.ricoh.com/technology/ai/LLM　
Hugging Face：「Qwen3-VL-Ricoh-8B-20260227」を公開
https://huggingface.co/ricoh-ai/Qwen-3-VL-Ricoh-8B-20260227
年間の研究成果をまとめた「リコーテクニカルレポートNo48」発行
https://jp.ricoh.com/info/2026/0318_1

リコーのAI開発の最前線：企業のAI活用を広げる「マルチモーダルLLM」
https://jp.ricoh.com/news/stories/articles/multimodal-llm

※社名、製品名は、各社の商標または登録商標です。

|　リコーグループについて　|

リコーグループは、お客様のDXを支援し、そのビジネスを成功に導くデジタルサービス、印刷および画像ソリューションなどを世界約200の国と地域で提供しています（2025年3月期グループ連結売上高2兆5,278億円）。

”はたらく”に歓びを　創業以来85年以上にわたり、お客様の“はたらく”に寄り添ってきた私たちは、これからもリーディングカンパニーとして、“はたらく”の未来を想像し、ワークプレイスの変革を通じて、人ならではの創造力の発揮を支え、さらには持続可能な社会の実現に貢献してまいります。

詳しい情報は、こちらをご覧ください。

https://jp.ricoh.com/

【株式会社リコー】 リコー、「GENIAC」第3期においてリーズニング性能を備えたマルチモーダル大規模言語モデルを開発

【株式会社リコー】リコー、「GENIAC」第3期においてリーズニング性能を備えたマルチモーダル大規模言語モデルを開発