|
データアナリティクスラボ株式会社(本社:東京都中央区、代表取締役:近藤 雅彦、以下 当社)は、エヴィクサー株式会社(以下 エヴィクサー)が総務省の「インターネット上の偽・誤情報等への対策技術の開発・実証事業」に採択されたプロジェクトの一環として実施された共同研究において、生成AIによる音声コンテンツの判定技術に関する研究成果を取りまとめましたのでお知らせいたします。 |
|
|
|
|
|
|
データアナリティクスラボ株式会社コーポレートロゴ |
|
|
|
|
|
|
本研究は、エヴィクサーの音響信号処理技術と当社のAI・データ分析技術を融合し、生成AIの高度化に伴い深刻化する偽・誤情報(ディープフェイク等)への対策技術の高度化を目的として実施されたものです。 |
|
|
|
■研究成果の概要 |
|
本研究では、生成AIによる音声コンテンツの特性を再現・分析し、合成音声の判定に向けた検証データおよびAIモデルの検証環境を構築しました。 |
|
|
|
■主な成果 |
|
1. 多様な音声生成モデルに対応した検証基盤の構築 |
|
日本語を含む合成音声の分析に向け、 |
|
・Tortoise |
|
・XTTS(多言語対応モデル) |
|
・Qwen3-TTS |
|
などの先端的な音声生成モデルを調査・比較し、複数の生成方式に対して検証を行いました。 |
|
|
|
特に、XTTSのような多言語・大規模学習に基づく音声生成技術にも対応することで、現実の生成AI環境に近い条件での検証を実施しました。 |
|
|
|
2. 合成音声データの体系的生成と特徴量解析 |
|
本研究では、 |
|
・合成音声データの生成条件の整理・体系化 |
|
・音声信号(スペクトログラム等)の解析 |
|
・自然音声との構造的差異の抽出 |
|
を実施し、合成音声の特性を定量的に捉える取り組みを行いました。 |
|
|
|
これにより、生成モデルに依存しない汎用的な判定技術の研究開発に向けた取り組みを行いました。 |
|
|
|
3. 深層学習による合成音声判定モデルの検証 |
|
生成音声の判定に関して、 |
|
・深層学習モデルの調査・検証 |
|
・学習用データセットの構築 |
|
・判定精度の評価プロセスの整備 |
|
を行い、AI音声特有の特徴を活用した判定モデルの有効性を一定程度確認しました。 |
|
|
|
4. 音響信号処理とAIの融合による技術高度化 |
|
本研究では、エヴィクサーが有する音響信号処理技術と当社のAI技術を組み合わせ、エヴィクサーの合成音声判定システム(EAF)の強化に向けた検証支援を行いました。具体的には、 |
|
・合成音声データの生成および多様な生成モデルの動作検証 |
|
・音声信号の特徴量解析による合成音声と自然音声の差異の把握 |
|
・深層学習モデルを用いた判定精度の検証および評価データセットの構築 |
|
を実施し、EAFの判定精度向上に向けた技術的知見の提供に取り組みました。 |
|
|
|
■本研究の位置づけ |
|
本研究は、エヴィクサー株式会社が主体となり総務省事業に採択されたプロジェクトにおいて、同社が音響信号処理およびAI対策技術の開発を担い、当社がデータ設計・解析および検証領域を担う形で推進されたものです。 |
|
|
|
当社は特に、 |
|
・合成音声データの生成および設計 |
|
・音声データの解析と特徴量抽出 |
|
・判定モデルの検証および評価基盤の構築 |
|
を担い、本研究全体の技術的高度化に貢献しました。 |
|
|
|
■社会的意義 |
|
生成AIの進展により、音声・映像コンテンツの信頼性確保は重要な社会課題となっています。 |
|
本研究成果は、 |
|
・ディープフェイク対策 |
|
・情報の真正性検証 |
|
・AIガバナンスおよび標準化対応 |
|
といった分野における技術開発に貢献しうる知見として位置づけられます。 |
|
|
|
|
|
■今後の展開 |
|
今後も、エヴィクサー株式会社と必要に応じて連携しながら、双方の強みを活かした取り組みを推進し、音響信号処理とAIを融合した偽・誤情報対策分野の発展に引き続き貢献してまいります。 |
|
|
|
|
|
■データアナリティクスラボ株式会社 https://dalab.jp/
|
|
代表者:代表取締役 近藤 雅彦 |
|
所在地:東京都中央区築地5-4-18 汐留イーストサイドビル6階 |
|
設立:2019年4月26日 |
|
資本金:2,000万円 |
|
事業内容:データ分析・AI活用支援、AI開発、データ人材教育サービスなど |
|
|
|
|