【DeepL】 Slatorの独立ベンチマーク調査で、DeepL Voiceが翻訳品質・字幕安定性ともに高い評価を獲得

プロの言語学者の96％がDeepL Voiceを支持、音声翻訳の速度と精度で業界をリード

ケルン（ドイツ）発 - 2026年3月25日 - AI製品と研究を手がけるグローバル企業であるDeepLは本日、翻訳・ローカライゼーション・通訳および言語AI分野の調査・市場分析を専門とするSlatorが実施した独立ベンチマーク調査の結果を発表しました。本調査では、Google Meet、Microsoft Teams、Zoomといった主要なオンライン会議プラットフォームにおけるリアルタイムAI翻訳および字幕機能の品質と安定性を比較検証しています。

グローバルチームによる多言語会議が日常化するなか、企業はコラボレーションや顧客交渉、国境を越えた意思決定を支える手段として、AI音声翻訳技術への依存を強めています。本調査は、DeepLの委託により実施され、Slatorが独立した立場で評価・分析を行ったもので、その結果、DeepL Voiceは翻訳品質および字幕安定性の両面で最も高い評価を獲得し、Google Meet、Microsoft Teams、Zoomに標準搭載されている字幕翻訳機能を上回る成果を示しました。

営業商談やサプライヤーとの交渉、経営戦略会議など、重要度の高い場面では、わずかな誤訳や字幕の不安定さであっても、議論の流れを妨げ、混乱を招き、意思決定の質を損なう可能性があります。グローバルビジネスが加速するなか、AI翻訳はもはや「あると便利な機能」ではなく、業務を支える基盤（インフラ）となりつつあります。その基盤の強さを左右するのが、翻訳の品質とライブ字幕の安定性という2つの要素です。

主な調査結果は次の通りです。

•

翻訳品質において最高スコアを記録：人による評価において、DeepL Voice（Zoom版）は100点満点中96.4点、DeepL Voice（Microsoft Teams版）は96.3点を獲得しました。これは、他の評価対象プラットフォームの87～89点を大きく上回りました。

•

重大度の高い翻訳エラーを平均76％削減：意味の取り違えなど、会議の進行や意思決定に大きな影響を及ぼす「致命的」または「重大」と評価される翻訳エラーの発生率を、他のプラットフォームと比べて平均76％低減しました。

•

完全に問題のない翻訳セグメントが79％：翻訳された字幕のうち、「問題なし（fully passing）」と評価された割合は79％に達し、競合ツール平均の42％を大きく上回りました。

•

字幕安定性においても高評価：Slatorによる自動フレーム単位分析において、DeepL Voice（Zoom版）は88.6／100点、DeepL Voice（Microsoft Teams版）は85.8／100点の安定性スコアを記録しました。

•

字幕の書き換え（ちらつき）を大幅に抑制：画面上で字幕が頻繁に書き換わる現象（caption churn）を、Microsoft Teams比で平均37.6％、Zoom比で平均54.7％削減しました。

•

ブラインド評価でプロ言語専門家の96％がDeepL Voiceを選好：すべてのブラインド評価を通じて、参加したプロの翻訳者・通訳者の96％がDeepL Voiceを最も優れたソリューションとして選びました。

DeepLのCEO兼創業者であるヤレック・クテロフスキーは、次のように述べています。

「言語AIは、グローバルビジネスのあり方を支える中核的なインフラになりつつあります。その文脈では、精度や安定性は“付加価値”ではなく、満たすべき要件です。今回の独立ベンチマーク調査は、DeepL Voiceがその両方において高い水準を実現し、リアルタイムコミュニケーションの高い水準を示していることを裏付けています。プロの言語専門家が圧倒的に一つのソリューションを支持したという事実は、市場の向かう先を明確に示すものだと考えています。」

また、本調査を担当したSlatorのコンサルティング責任者であるアレックス・エドワーズ氏は、次のようにコメントしています。

「私たちは単なる最終的な翻訳精度だけでなく、AI字幕の“人が読む側面”、可読性、流暢さ、そして安定性に注目しました。最終的に正しい訳になっているかだけでなく、会議中に人が読んでいる間、字幕がどのように表示され、どう振る舞うのかを評価しました。その結果、言語品質と画面上の字幕挙動の両面で、DeepLが新たなベンチマークを打ち立てていることが明確に分かりました。」

精度と同じくらい「安定性」が重要な理由

本調査では、翻訳自体が概ね正確であっても、字幕が頻繁に書き換わることで理解が妨げられ、実際の会議における使い勝手が低下する可能性があると指摘されています。

こうした実利用の観点を反映するため、Slatorは画面に表示される字幕をフレーム単位で分析し、ちらつき（flicker）、揺れ（oscillation）、時間経過に伴う書き換え挙動を捉えることで、「字幕の安定性」を測定しました。

調査方法について

本調査では、28名のプロ翻訳者・通訳者が参加し、14の言語組み合わせ（英語への翻訳7言語、英語からの翻訳7言語）について、AI翻訳字幕をブラインド形式で評価しました。

Google Meet、Microsoft Teams、Zoomについては標準（初期設定）の字幕翻訳機能を評価対象とし、これらとDeepL Voice（Microsoft Teams版／Zoom版）を比較しています。DeepL Voiceについては、用語集や発話語句の認識など、エンドユーザーが利用可能な機能も含めて評価されました。Slatorは、本調査の結論が独立したものであり、調査手法および結果に関する編集権を保持していることを明記しています。

本調査結果は、2026年4月に予定されているDeepLのグローバル発表に先立ち公開されたものです。詳細については後日発表予定です。

DeepLについて

DeepLは、グローバルビジネスを支える言語インフラを構築するグローバルAI企業です。20万社以上の法人顧客と数百万人の個人がDeepLの言語AIプラットフォームを活用し、言語の壁を越えたコミュニケーションやコラボレーションを実現し、多言語環境での業務遂行を支えています。革新的なAIモデルとエンタープライズレベルのセキュリティおよびプライバシー保護を組み合わせることで、企業や組織が、市場や文化の違いを越えて円滑に事業を展開できるよう支援しています。2017年にCEOのヤレック・クテロフスキーによって設立されたDeepLは、現在1,000人以上の従業員を擁し、Benchmark、IVP、Index Venturesなどの有力投資家から支援を受けています。詳しくは www.deepl.com をご覧ください。

Slatorについて

Slatorは、翻訳、ローカライゼーション、通訳、言語AI分野における調査および市場分析を提供するリーディングカンパニーです。Slatorのコンサルティング部門は、独立した業界分析を求める企業の購買担当者、言語テクノロジープラットフォーム、言語ソリューションインテグレーターにとって信頼できるパートナーとして支援を行っています。

レポート全文はこちらよりご覧いただけます。