国産生成AI基盤の独自開発およびビジネス向け生成AIサービスを提供するストックマーク株式会社(本社:東京都港区、代表取締役CEO:林 達、以下:ストックマーク) は、現在開発中の視覚言語モデル(Vision-Language Model、以下:VLM)において、NVIDIAが提供する日本語のペルソナ合成データセット、「Nemotron-Personas-Japan」を活用しております。
 
 Nemotron-Personas-Japanは、NVIDIAが拡充を続けるオープンなペルソナ合成データセットのコレクションの一部であり、開発者が各地域の言語、文化、そして実世界の文脈に基づいたAIシステムを構築できるよう支援することを目的としています。このコレクションには日本の他、米国、インド、ブラジル、シンガポール、フランスのデータセットも含まれています。
 
 このデータセットは、統計的に裏付けられた合成ペルソナを提供しており、これを利用して、特定の分野に特化したAIアプリケーション向けの現実的なトレーニングデータを生成することができます。
 
 Nemotron-Personas-Japanの活用により、ストックマークは、多様なペルソナ(人格・役割)の設定に基づいた、豊富なバリエーションの合成データ生成を実現し、人手によるアノテーションでは網羅することが困難だった、製造環境などにおける専門性の高い多種多様な視点やシナリオを学習データへ精密に反映することが可能となりました。
 
 この高品質かつ網羅的なデータセットを通じて、ストックマークは、製造業特有の複雑なドキュメントを読解可能なVLM開発と実世界への生成AIの実装を加速いたします。
背景:日本のビジネス/製造業AIにおける「データ不足」
 現在、多くの企業で生成AI活用が進む一方で、製造業における「ドキュメントの理解」には大きな障壁が存在しています。工場内のフロー図、設計図面、複雑なチャートなどは、単なる文字だけでなく、現場の「文脈」や「専門知識」がないと正しく解釈できません。
 
 しかし、こうした専門性の高い画像に対する教師データ(説明文)を全て人手で収集・作成するには多大なコストと時間がかかり、数年単位のプロジェクトになることも珍しくありません。また、汎用的な海外ベースのVLMでは、製造現場特有の機器名称、安全基準に代表される習慣を正確に捉えきれないという課題がありました。
 
 ストックマークはこの課題を解決するため、NVIDIAの合成データ生成ワークフロー「Nemotron-Personas-Japan」を活用することで、圧倒的な多様性を誇る教師データの生成を圧倒的なスピードと質で実現し、製造業特化VLMの開発を行いました。
 
 
Nemotron-Personas-Japanによる合成データ生成
 今回のVLM開発に用いた全250万件の学習データセットのうち、約半数の教師データ生成を本ワークフローによる合成データで構築しました。これにより、人手では数年を要するデータ作成を圧倒的な短期間で完遂し、かつ以下のメリットを享受することに成功しました。
日本独自の現場文脈を反映
 Nemotron-Personas-Japanを活用して生成された、日本の商習慣や現場規律に基づいた自然な日本語を学習させることで、日本企業の実務に即した応答精度を実現しました。
多種多様なプロフェッショナル・ペルソナの再現
 「熟練工」「安全管理者」「機械設計部門のベテランエンジニア」など、多様なペルソナを仮想的に生成。画像に対してそれぞれの専門視点から高品質な解説文を付与することで、日本独自の現場規律や業務上の文脈を含んだ、自然な日本語学習を実現しました。
 
 
Nemotron-Personas-Japanの活用で生成した教師データ
 Nemotron-Personas-Japan を用いることで、製造業における現場作業者、安全管理者、機械設計部門のベテランエンジニアなどの多様なペルソナを条件として付与したデータ生成が可能となり、日本のビジネス文書特有の複雑な表現や形式を維持しながら、異なる業務視点に基づく多様な日本語データを大量に生成できるようになりました。
 
▼Nemotron-Personas-Japanを活用して生成したデータサンプル
 
ストックマークのソリューションについて
 AI活用は競争力維持のために不可欠な要素となっています。しかし、多くの企業が「データが整備されていない」「現場への定着が進まない」「具体的な成果に繋がらない」といった課題に直面しています。ストックマークは、こうした課題を包括的に解決するため、以下の6つソリューションを提供しています。
ストックマーク株式会社について
 ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI技術を活用し、多くの企業の企業変革を支援しています。
 製造業向けAIエージェント「Aconnect」及び、あらゆるデータを構造化し企業の資産に変える「SAT」を運営しています。さらに、企業特化生成AIの開発や、独自システムの構築も支援しています。
 
会社名 :ストックマーク株式会社
所在地 :東京都港区南青山一丁目12番3号  LIFORK MINAMI AOYAMA S209
設立  :2016年11月15日
代表者 :代表取締役CEO 林 達
事業内容:最先端の生成AI技術を活用した、
     企業のナレッジマネジメント・生成AIの業務適用を支援するサービスの開発・運営
URL  :https://stockmark.co.jp/