音声翻訳機能の概要
この音声翻訳機能は、99言語間で音声を変換します。翻訳品質は、元の言語の単語誤り率に準じます。録音ファイルをアップロードするか、ブラウザでライブで話すことができます。ダウンロード、アカウント登録、時間制限は一切ありません。
オーディオファイルをドロップすれば、翻訳されたテキストが出力されます。 MP3、WAV、M4A、MP4、OGG、FLACをアップロードしてください。モデルが元の言語を文字起こしし、選択したターゲット言語に翻訳を実行し、結果を字幕用のプレーンテキスト、SRT、またはVTTとしてエクスポートします。最大3時間のファイルでも一度の処理で対応します。
ライブ翻訳は同じブラウザタブで実行されます。 マイクをクリックして話し始めると、1.5秒以内に翻訳されたテキストが表示されます。国際的なサポート通話、ベンダー会議、バイリンガルインタビューなど、録音が完了するのを待つことができない状況で役立ちます(2026年4月のレイテンシーベンチマーク)。
主な機能:
- あらゆる原言語から英語への音声翻訳(自動検出機能付き)
- 1.5秒未満の遅延でのライブ音声翻訳
- 最大3時間のオーディオファイルアップロード(MP3、WAV、M4A、MP4、OGG、FLAC)
- 会議、通話、プレゼンテーションのための無料ライブ音声翻訳機能
- アクセント、方言、バックグラウンドノイズに96%以上の精度で対応
- 翻訳を音声として再生する音声出力
- ブラウザベース、インストール不要
- ドキュメント作成と検索のためのタイムスタンプ付き文字起こし
このツールは、録音された会議、ポッドキャスト、インタビュー、顧客サポート通話、ビデオコンテンツ向けに構築されています。リアルタイムでの会話にはライブモードを、検索可能な文字起こしを含む一括作業にはファイルをアップロードして使用してください。
言語ペア品質マトリックス
翻訳品質は文字起こし品質に準じます。原言語の単語誤り率(WER)が低いペアは、翻訳処理が解釈する曖昧な入力が少ないため、よりクリーンな翻訳を生成します。以下の数値は2026年4月WER再テストによるものです。
| 言語ペア | 平均WER(文字起こし) | 翻訳品質 | 備考 |
|---|---|---|---|
| en, es | 4-5% | 優秀 | 最も利用頻度の高いペア、最もトレーニング済み |
| en, pt | 5-6% | 優秀 | ブラジルおよびヨーロッパのバリアントをサポート |
| en, fr | 5-6% | 優秀 | ケベックフランス語に対応 |
| en, de | 6-7% | 良好 | 複合語を正しく処理 |
| en, ja | 7-8% | 良好 | 句読点を再構築 |
| en, zh | 7-8% | 良好 | 簡体字と繁体字 |
| en, ko | 7-8% | 良好 | 敬語表現を保持 |
| es, pt | 5-6% | 優秀 | 相互理解度が高い |
| en, ar | 9-10% | 許容範囲 | MSAのみ、方言カバー率限定的 |
| en, hi | 9-10% | 許容範囲 | 英語とのコードスイッチングに対応 |
リストにないペアについては、言語ごとの精度表で原言語のWERを調べ、WERのバケットと最終的な翻訳の間に約1段階の品質ティアを追加してください。WERが10%以上のペアでも、大意を把握するための有用な翻訳は生成されますが、固有名詞やイディオムの微調整が多く必要になることを想定してください。
音声翻訳機能の使い方
録音をアップロードする場合でも、ライブで話す場合でも、このツールは以下の3つのステップで動作します。
- オーディオファイル(MP3、WAV、M4A、MP4、OGG、FLAC)をアップロードするか、マイクをクリックしてライブで話します
- AIが100以上のオプションから元の言語を自動的に検出します
- 音声が96%以上の精度でタイムスタンプ付きで目標言語に変換されます
- テキストをコピーするか、翻訳された文字起こしをダウンロードします
対応言語には、スペイン語、フランス語、ドイツ語、中国語、日本語、韓国語、アラビア語、ヒンディー語、ポルトガル語、ロシア語、イタリア語、オランダ語、その他90以上の言語が含まれます。
ライブ音声翻訳モードは、1.5秒未満の遅延で会話を即座に処理します。ビジネス会議、顧客通話、インタビュー、国際プレゼンテーション向けに構築されています。タブを切り替えることなく、通話中にクリックして話し、翻訳できます。
マイク入力は、ブラウザで直接あなたの音声をキャプチャします。マイクボタンをクリックし、許可を与えて話してください。AIが言語を検出し、コンテンツを翻訳し、結果を表示します。デスクトップおよびモバイルブラウザで動作します。
音声翻訳機能 vs その他のツール
| 機能 | ScreenApp | Maestra | Sonix | Notta | Speechmatics | Veed.io |
|---|---|---|---|---|---|---|
| 対応言語 | 100以上 | 125以上 | 53 | 58 | 50以上 | 125以上 |
| 原言語を自動検出 | はい | はい | はい | はい | はい | はい |
| 吹き替え出力用の音声クローン | いいえ(TTS音声) | はい | いいえ | いいえ | いいえ | はい |
| ファイルサイズ / 長さ制限 | アップロードごとに3時間 | ファイルあたり5 GB | 4 GB / 5時間 | 2 GB / 5時間 | ファイルあたり2 GB | ファイルあたり2 GB |
| 無料枠 | 無制限(分) | 30分トライアル | 30分トライアル | 120分/月 | 8時間/月 | |
| エクスポート形式 | TXT, SRT, VTT, DOCX | SRT, VTT, TXT, DOCX | SRT, VTT, TXT, DOCX | TXT, SRT, DOCX, PDF | TXT, SRT, JSON | SRT, VTT, TXT |
| 料金(有料) | 無料 | $29/月 | $22/時間 | $14.99/月 | $0.30/時間 API | $24/月 |
- vs Maestra: Maestraは、話者の音声をクローンし、ターゲット言語での吹き替え再生を可能にします。これはビデオのローカライズに役立ちます。無料トライアルは30分に制限されています。ScreenAppはクローンではなく汎用TTS音声を使用しますが、無料利用には時間制限がなく、SRT/VTTを直接エクスポートできます。
- vs Sonix: Sonixは53言語に対応しており、30分間のトライアル後、オーディオ1時間あたり22ドルを請求します。ScreenAppは99言語に対応し、無料で翻訳できますが、Sonixは長時間の会議録音においてより強力な話者分離ラベルを持っています。
- vs Notta: Nottaは58言語で月に120分の無料枠を提供し、ビデオ作業用にSRTをエクスポートします。ScreenAppはより多くのファイル形式(OGG、FLACを含む)を受け入れ、月間の時間制限をなくしていますが、NottaはZoomやGoogle Meetのボット統合がより緊密です。
- vs Speechmatics: SpeechmaticsはAPIファーストの文字起こしエンジンで、オーディオ1時間あたり0.30ドルで課金され、月に8時間の無料枠があります。翻訳するには開発者による統合が必要です。ScreenAppはコードなしでブラウザで動作します。
- vs Veed.io: Veed.ioは、ビデオエディター向けにAI音声クローニングと画面上の字幕スタイルを追加し、月間30分の無料枠があります。ScreenAppは音声からテキストへの翻訳パスに焦点を当てており、ビデオ編集はスキップしますが、より長いファイル(3時間 vs 2 GB)を無料で処理します。
音声出力付き翻訳
この音声翻訳機能は、ターゲット言語でテキスト文字起こしと音声オーディオを返します。音声をテキストに変換した後、テキスト読み上げ機能を使用して自然な音声オーディオを再生します。
音声出力機能:
- 地域のアクセントを含む100以上の言語音声での自然な発音
- 翻訳されたオーディオを遅くしたり速くしたりできる調整可能な読み上げ速度
- ほとんどの言語で男性または女性の音声オプションを選択できる性別選択
- ライブ会話中の即時再生
- 翻訳された音声のダウンロード可能なオーディオファイル
音声出力は、語学学習、アクセシビリティ、またはテキストを読むのが現実的でないあらゆる状況(電話、運転中、ハンズフリー会議など)で活用できます。音声による翻訳は、発音やイントネーションの学習にも役立ちます。
音声翻訳機は誰のためのものか
多言語コンテンツを出荷するローカリゼーションチーム は、各展開市場向けのSRTファイルを生成するため、ソース言語のナレーション、広告スポット、製品チュートリアルを翻訳機に通します。100以上の言語に対応しているため、単一リリースに必要なベンダーの数を削減できます。
外国語のインタビューをカバーするジャーナリスト は、録音したその日に現場録音をアップロードします。文字起こしと翻訳はタイムスタンプ付きで返されるため、記者は別途調整役を雇うことなく00:14:32の引用を提示できます。
バイリンガル教材を準備する語学教師 は、ポッドキャストやニュースクリップをツールに投入し、元の文字起こしと英語翻訳の両方を取り出します。学生は2つを並べて比較し、SRTエクスポートは教室のビデオプレーヤーに接続できます。
非英語の音声チケットを処理するサポートチーム は、チームの言語を話さない顧客からのボイスメールやZoom録音を翻訳します。エージェントはヘルプデスクで翻訳された文字起こしを読み、バイリンガルキューにチケットをルーティングすることなく書面で返信します。
FAQ
ライブ音声を英語に翻訳するにはどうすればよいですか?
マイクボタンをクリックし、任意の言語で話すと、ツールは1.5秒以内に英語翻訳を返します。AIは100以上のオプションからソース言語を検出し、英語テキストとオプションの音声の両方を出力します。アプリのインストールは不要です。
音声ファイルを英語に翻訳するにはどうすればよいですか?
MP3、WAV、M4A、MP4、OGG、またはFLACファイルをアップロードします。このツールはソース言語を検出し、音声を高精度で英語テキストに変換します。ドキュメントや検索のために、タイムスタンプ付きの翻訳された文字起こしをダウンロードしてください。
オンラインで最高の音声翻訳機は何ですか?
それは仕事によります。SonixとSpeechmaticsは、有料ユーザー向けに最もクリーンな長尺の文字起こしを生成します。MaestraとVeed.ioは、吹き替え出力用のクローン音声が必要な場合に役立ちます。ScreenAppは、99の言語で音声ファイルのアップロードとライブ音声を分数の制限なしに処理するため、アドホックな翻訳作業の良いデフォルトとなります。
音声翻訳機を無料で利用できますか?
はい。無料ユーザーは99の言語で無制限のファイルとライブ翻訳を利用できます。Microsoft Translatorは365ユーザーを月300分に制限しています。DeepL Voiceの無料枠は1日30分で停止します。ScreenAppには制限がありません。
音声から英語への翻訳はどのように機能しますか?
マイクに向かって話すか、録音をアップロードしてください。AIが100以上のオプションからソース言語を検出し、1.5秒以内に英語のテキストを出力します。音声再生はオプションです。
動画作業用に翻訳された字幕をエクスポートできますか?
はい。翻訳後、エクスポートメニューでSRTまたはVTTを選択してください。ファイルはソースのタイムスタンプを使用するため、Premiere、Final Cut、DaVinci Resolve、YouTube Studioでキャプションが正しいフレームに表示されます。書面での成果物には、プレーンテキスト(TXT)およびDOCXも利用可能です。
このツールは複数人の録音で話者ラベルを保持しますか?
トランスクリプトは、声が明確に分離されている場合に話者の切り替わりをマークし、それらのラベルを翻訳された出力に引き継ぎます。会議の録音で発言が重なっている場合、ラベルは最大限の努力として提供され、重なっている箇所を自分で確認した方が良い場合があります。
リアルタイム翻訳はどのように機能しますか?
ライブモードでは、ブラウザのマイクを使用します。このツールは音声をキャプチャし、音声認識を実行し、ソース言語を検出し、ターゲット言語に翻訳し、オプションの音声付きでテキストを出力します。遅延は1.5秒未満です。
動画ファイルから音声を翻訳できますか?
はい。MP4、AVI、MOV、MKV、WEBM、または3GPファイルをアップロードしてください。このツールは音声ファイルを抽出し、スピーチを翻訳し、タイムスタンプ付きの完全なトランスクリプトを返します。動画編集用に翻訳された字幕をSRT形式でエクスポートしてください。
どのような音声ファイル形式を翻訳できますか?
MP3、WAV、M4A、AAC、MP4、OGG、FLAC。最長3時間のファイルをアップロードでき、言語は自動検出されます。
翻訳ツールの音声認識精度はどのくらいですか?
99言語で96%以上の精度です(2026年4月モデル更新)。一般的な言語ペアではさらに高く、スペイン語-英語で97.2%、フランス語-英語で96.8%、標準中国語-英語で96.4%です。このモデルは、地域の方言、アクセント、バックグラウンドノイズ、専門用語に対応しています。
音声翻訳ツールはモバイルでも動作しますか?
はい。iOSとAndroidのモバイルブラウザで動作します。アプリのインストールは不要です。インターフェースは小さい画面にも対応しています。
音声翻訳ツールはソース言語を自動的に検出できますか?
はい。AIは、音素と音声パターン分析を使用して、地域の方言やアクセントを含む99言語からソース言語を識別します。目的言語を選択するだけで済みます。
ライブ音声翻訳ツールは無料ですか?
はい。1分あたりの制限、サブスクリプション、登録なしで、無料でライブ翻訳を利用できます。
音声翻訳ツールは安全に使用できますか?
はい。音声ファイルはHTTPS経由で送信され、翻訳後に自動的に削除されます。お客様の音声が公開AIモデルのトレーニングに使用されることはありません。このツールは個人情報やアカウントを必要としません。エンドツーエンド暗号化によりGDPRに準拠しています。