ー フィジカルAI開発における大規模データ処理への適応を目指す ー
 
ロボット基盤モデル及びドメイン特化のVLAモデル開発を支援する FastLabel株式会社(本社:東京都新宿区、代表取締役CEO:鈴木健史、以下 FastLabel)による「VLMを用いたドメイン特化型セマンティック重複排除技術」に関する研究成果(※1)が、3月16日~3月19日まで米国およびバーチャルで開催されるNVIDIA主催の世界最大級のAIカンファレンス、「GTC 2026」のポスター発表に採択(※2)されましたのでお知らせします。
(※1) https://www.nvidia.com/ja-jp/case-studies/fastlabel-accelerates-image-data-processing-with-nemo-curator/
(※2)「GTC 2026 」において研究や技術成果をポスターにまとめ会場の専用スペースにて展示できる権利
 
今回のポスターでは、AI開発において画像埋め込みをベースにする場合、重複画像排除時の「ドメイン固有の重要な差異(例:歩行者の有無)を見逃す」という課題を、VLMによる高度なキャプショニングとNVIDIA NeMo Curatorを組み合わせることで解決したことを発表しています。発表の総括としては、自動運転開発等のミッションクリティカルな領域において、安全性に直結する「稀なシーン」を確実にデータとして保存しながら、効率的にデータセットを軽量化する先駆的なパイプライン構築方法を提案しています。
 
<今回採択されたポスター発表における主な内容>
高品質なデータ選別: 従来の画一的な類似度判定ではなく、ドメイン知識に基づいた「意味のある差異」を識別。モデルの汎化性能と安全性を劇的に向上させます。
コストと時間の最適化: 10,000枚の画像をわずか4分で処理(Deduplication工程)する圧倒的なスケーラビリティを実現し、膨大な学習コストとアノテーション費用の削減に寄与します。
モデル性能の最大化: 「ありふれたシーン」を減らし「クリティカルなシーン」を高密度化することで学習効率と実環境での汎用性能を向上させます。
<今回発表した技術を応用した今後の展望>
今後は、本技術のコアである「埋め込みベクトルによる異常・希少性の検知」をロボティクス・VLA(Vision-Language-Action)モデルの構築へと応用展開してまいります。
動画データの最適化: ロボットの作業動画から、タスクの開始・終了状態の異常値を「重複排除の残差」として自動検知し、質の高い学習データを抽出します。
姿勢・関節データの解析: 画像だけでなく、アームの関節角度等の時系列データをベクトル化して扱うことで、ロボットの「異常姿勢」や「未知の動作パターン」を特定。
FastLabelは、データの質がAIの性能を決定する「Data-centric AI」の潮流において、自動運転から複雑な物理環境で動くロボティクスまで、あらゆる最先端領域の進化を加速させてまいります。
 
【FastLabelについて】
FastLabel株式会社は、Data-centric AI開発を支えるデータ基盤の構築に取り組み、データ収集・生成からアノテーション、モデル開発、DataOps構築までを一気通貫で支援しています。近年はロボティクスを含むフィジカルAI領域にも注力し、ロボット基盤モデルおよびVLAモデル開発を支えるデータパイプラインの構築を推進しています。
 
社名:FastLabel株式会社
所在地:東京都新宿区西新宿2-6-1  新宿住友ビル24階
代表:代表取締役CEO 鈴木健史
事業内容:Data-centric AI開発を支援するプロフェッショナルサービスとプロダクトの提供
URL:https://fastlabel.ai/service/robotics