テキストを介さない“音声特化型基盤モデル”の社会実装を加速
音声対話AI基盤モデルの研究開発を行う株式会社DubGuild(本社:東京都文京区、代表取締役:大嶽 匡俊)は、ソフトバンク株式会社が提供するスタートアップ支援プログラム「AI Foundation for Startups(AIFS)」へ参加することをお知らせいたします。
本プログラムへの参加を通じて、当社が開発する音声のみを学習した対話基盤モデルの高度化および事業展開を加速してまいります。
 
AIFS参加の背景
近年、生成AIの進化により音声AI分野への注目が高まっています。しかし、従来型の音声AIは多くの場合、音声からテキストへ変換し、その後言語処理を行い、再び音声を生成するという構造を前提としていました。
この構造では、あいづちや相互作用のタイミング、発話の重なり、感情の揺らぎ、会話における自然な「間」といった時間的・感情的情報を十分に扱うことが困難でした。これらの要素はテキスト化の過程で失われやすい情報です。
 
DubGuildの技術的特徴
株式会社DubGuildでは、テキストを介する旧来型モデルとは異なり、音声のみを直接学習する基盤モデルを開発しております。
このアプローチにより、AIが扱える情報量は大幅に増加し、自然なあいづち応答、発話の重なりの処理、感情表現を反映した音声生成、低レイテンシでのリアルタイム翻訳、そして会話の時間構造を保持したインタラクションの実現が可能となります。
これは単なる音声認識技術ではなく、人間の会話構造そのものを扱う音声特化型Foundation Modelである点が最大の特徴です。
 
今後の展望
AIFSを通じて提供される大規模GPU計算基盤を活用し、音声特化型基盤モデルのさらなる高度化を進めてまいります。加えて、企業および研究機関との連携を強化し、実証実験および商用化を加速させます。
AI音声吹き替え、多言語リアルタイム翻訳、次世代音声インタラクション領域において、世界市場を見据えた展開を目指します。
 
代表コメント
代表取締役 大嶽 匡俊
「私たちは、言語の壁を壊したいと本気で考えています。現在、世界には素晴らしいコンテンツが数多く存在していますが、その多くは言語の壁に阻まれ、本来得られるはずの評価を受けられていません。
DubGuildは、“世界観を崩さない吹き替え”を実現する音声基盤技術とともに、あらゆるローカルコンテンツを世界へ届けることを目指しています。AIFSへの参加を追い風に、音声を直接理解する基盤モデルの進化を加速させ、言語を超えた体験価値を創出してまいります。」
 
会社概要
会社名:株式会社DubGuild
代表者:代表取締役 大嶽 匡俊
所在地:〒113-0023 東京都文京区向丘2丁目3-10 東大前HiRAKUGATE
Webサイト:https://dubguild.com/
事業内容:音声対話AI基盤モデルの研究開発、生成AI技術開発