TDSE株式会社(東京都新宿区、代表取締役社長:東垣直樹、以下 TDSE)は、奈良先端科学技術大学院大学(以下 NAIST)と共同で進めてきた自然言語処理研究の成果が、最新AI技術の国際会議であるCOLM 2025(Conference on Language Modeling)にて採択されたことをお知らせします。

近年、生成 AI の中核である大規模言語モデル(LLM)は高精度な回答を示す一方で、内部知識の陳腐化や複雑な質問で誤答(ハルシネーション)が起こることが課題となり、外部文書を参照する検索拡張生成(RAG)が注目されています。しかし従来の RAG では検索と生成の連携が不十分で、応答の一貫性や精度向上に限界がありました。こうした背景を踏まえ、本研究では LLM が検索と生成を繰り返すことにより検索語を改良し文書検索精度を向上する新手法「IterKey」を提案し、RAG 全体の性能向上を実現しました。

今回採択された論文では、大規模言語モデル(LLM)が自動でキーワードを生成・検証しながら検索を繰り返す手法「IterKey」を提案しました。このプロセスにより、従来の BM25 を用いた RAG と比べて質問応答精度を最大 20% 高め、ベクトル検索型 RAG と同等の性能を達成しつつ、検索語が見える形で透明性を確保できます。大規模文書データベースでも高速に動作し、RAGの性能評価や説明責任が求められる現場で有用であると示しました。

COLM 2025(Conference on Language Modeling)は、AIの基盤技術である言語モデルの最新技術に関する国際会議です。世界各国の大学や研究機関、企業が最新の研究成果を発表し、特に生成AIや検索拡張生成(RAG)などの応用技術が注目されています。論文は専門家による厳格な審査を通過したものだけが採択されており、AI技術の実用化に向けて最新の動向を知ることができる重要な場となっています。

TDSEでは、今後も奈良先端科学技術大学院大学をはじめとするパートナーの皆様との研究開発によりLLMなど技術の新たな可能性を開いてまいります。

ITERKEY: LLM を用いた反復的キーワード生成による検索拡張生成の最適化

TDSE株式会社と奈良先端科学技術大学院大学による共同研究 -LLMハルシネーション問題解決への共同挑戦-(2024)

担当:AIエージェント本部 セールス&マーケティンググループ

※現在全社テレワーク導入のため、お問い合わせはメールにてお願いいたします。