Overtone
USER GUIDE v1.0.0-beta.22

Overtone

ユーザーガイド
User Guide
SaaS Edition — ログインから翻訳まで完全マニュアル
SaaS Edition — Complete Guide from Login to Translation
このガイドを読めば、ブラウザ1つで
海外の方とのリアルタイム音声翻訳会議が
すぐに始められます。
With this guide, you can start real-time
voice translation meetings with international
colleagues right away — just using a browser.
SECTION 01

Overtone とはWhat is Overtone?

言葉を越え、真の対話を引き出す。Beyond words, drawing out true dialogue.
🌐
何ができるアプリ?
What can this app do?
Web会議中の相手の外国語発言をリアルタイムで翻訳し、
自分の発言を相手の言語に翻訳したテキストと音声で届けるアプリです。
※ ブラウザだけで動作。PCやスマートフォンにアプリのインストールは不要
This app translates your counterpart's foreign-language speech in real time during video calls,
and delivers your own speech translated into their language as text and audio.
※ Works entirely in the browser — no app installation required on PC or smartphone.
✨ 主な機能✨ Key Features
🌐
多言語混在対応Code-Switching
1つの会議内で
言語が切り替わっても
自動判別して翻訳
Auto-detects language
switches within a single
meeting
📝
議事録モードMinutes Mode
同じ言語のみの会議は
自動で原文整形
(議事録向け)
Same-language meetings
auto-clean original text
(for minutes)
👥
話者分離Speaker Separation
複数人の声を識別し
色分けで表示
Identifies multiple voices
and color-codes each speaker
🔊
AI音声読み上げAI Voice Playback
翻訳文を自然な
AI音声で再生
Reads translations aloud
in natural AI voice
📱
PC + iPhone
PCでテキスト翻訳、
iPhoneで音声翻訳
Text on PC,
voice on iPhone
📊
CSV・ログ出力CSV & Log Export
翻訳履歴を
ファイルに保存
Save translation history
to a file
📍 会議翻訳の流れ📍 Meeting Translation Flow
ログインSign In
Google / Email
設定Setup
音声デバイス選択Select audio device
画面共有Screen Share
Teams音声取込Capture Teams audio
起動Launch
翻訳スタート!Translation starts!
終了・保存Finish & Save
CSV出力CSV Export
💻
必要なもの:Google Chrome または Microsoft Edge ブラウザ、マイク(ノイズキャンセリングヘッドフォン推奨) Requirements: Google Chrome or Microsoft Edge browser, microphone (noise-cancelling headphones recommended).
2
STEP 01

ログインするSign In

Authentication — Google / Email OTP
🔐
方法A — Googleでログイン Method A — Sign in with Google
Sign in with Google Account

ステップ Steps

1
アプリのURLにアクセスする Open the app URL
管理者から共有されたURLをブラウザで開きます Open the URL shared by your administrator in your browser
2
「Googleでログイン」ボタンをクリック Click "Sign in with Google"
Googleアカウント選択画面にリダイレクトされます You will be redirected to the Google account selection screen
3
登録済みのGoogleアカウントを選択 Select your registered Google account
管理者がアクセス権を付与したメールアドレスでログインしてください Log in with the email address that your administrator has granted access to
4
設定画面が表示されれば成功! Setup screen appears — you're in!
ユーザー名とロール(ADMIN / USER)がヘッダーに表示されます Your username and role (ADMIN / USER) will appear in the header
🌐 Overtone 言葉を越え、真の対話を引き出す。 G Googleでログイン または メールアドレスを入力 📨 コード送信
🌐 Overtone Beyond words, drawing out true dialogue. G Sign in with Google or corporate@company.com 📨 Send Code
💡 Googleアカウントがあれば、ワンクリックで即ログインできます If you have a Google account, you can sign in with a single click.
📧
方法B — メールでOTPログイン Method B — Email OTP Login
6桁の認証コードをメールで受け取る Receive a 6-digit code by email

ステップ(Google以外のメールアドレスをお持ちの方) Steps (for non-Google email addresses)

1
メールアドレス入力欄に登録済みのアドレスを入力 Enter your registered email address
例:yourname@hotmail.com、yourname@outlook.jp など e.g. yourname@hotmail.com, yourname@outlook.jp
2
「📨 コード送信」ボタンをクリック Click the "📨 Send Code" button
6桁の認証コードがメールで届きます(送信元:contact@uxsommelier.com) A 6-digit code will be sent to your email (from: contact@uxsommelier.com)
3
届いたメールの6桁コードを確認 Check your email for the 6-digit code
件名「Overtone 認証コード」のメールを確認してください Look for the email with subject "Overtone Verification Code"
4
コードをアプリに入力して「✅ ログイン」をクリック Enter the code in the app and click "✅ Login"
コードの有効期限は10分です The code expires after 10 minutes
💡 パスワードは一切不要。メールに届いた6桁のコードを入力するだけでログインできます No password needed. Just enter the 6-digit code sent to your email.
3
STEP 02

プランの確認と変更View & Change Your Plan

Subscription Plans
💳
利用プランの確認・変更
Manage your subscription and minutes

Overtone のプラン構成

1
STARTER 無料体験 (🆓 7 日 OR 240 分)
新規登録時、Starter プランの全機能を 7 日間または累積 240 分まで無料で体験できます (どちらか早い方で終了)。クレジットカード登録が必須です (オーソリのみ)。期間終了時に解約していなければ、自動的に Starter ($9.99/月) へ移行します。期間中はマイページからいつでも無料で解約可能です。
2
STARTER (🟢, $9.99/月 / 税込 $10.99)
240分(4時間)/月。Viewer 共有 + CSV 出力 + 議事録 PDF + Companion View (iPhone / Android)。基本的なチーム連携が可能です。
3
STANDARD (🔵, $24.99/月 / 税込 $27.49, POPULAR)
480分(8時間)/月。音声クローン機能が利用可能。個人ユースから小規模チームまで、最も人気のプランです。
4
PREMIUM (🟣, $49.99/月 / 税込 $54.99)
960分(16時間)/月。最高品質の翻訳エンジンが自動選択され、複雑な商談や多言語ビジネスに対応できます。
💡 消費税について: 表示価格は本体価格です。日本居住者には Stripe Tax が消費税 10% を自動加算します。海外居住者は輸出免税で本体価格のみ。インボイス番号は申込履歴 PDF より取得可能です。
ダッシュボードの見方 (体験期間中)
TRIAL (Day 3 / 7)
180/ 240 分 残
プラン管理
体験期間: あと 4 日 / 残 180 分 (どちらか早い方で Starter に自動移行)
💡
音声翻訳について:STANDARD 以上のプランでは「オリジナル音声モード」(音声クローン機能)で自分の声を音声翻訳に指定できます。
💳
View & Change Your Plan
Manage your subscription and minutes

Overtone Plans

1
STARTER FREE TRIAL (🆓 7-day or 240 min)
New users get full Starter access for 7 days or 240 minutes (whichever ends first). Credit card required (authorization only, no charge upfront). After trial, the account auto-converts to Starter ($9.99/mo) unless cancelled. You can cancel anytime during the trial from your account page — no charge if cancelled before trial ends.
2
STARTER (🟢, $9.99/mo)
240 min (4 hours) per month. NEW: Viewer sharing + CSV export for basic team collaboration.
3
STANDARD (🔵, $24.99/mo, POPULAR)
480 min (8 hours) per month. Unlocks voice cloning. Most popular for individuals and small teams.
4
PREMIUM (🟣, $49.99/mo)
960 min (16 hours) per month. Highest quality translation engine auto-selected for complex business conversations.
Dashboard overview
FREE TRIAL
56/ 60 min
Upgrade
💡
About Voice Translation: STANDARD and above plans unlock "Original Voice Mode" (voice cloning) to use your own voice for translated speech output.
4
STEP 03

言語を設定するLanguage Settings

Language Configuration — Your Language & Session Languages
🌐
Language Settings
How language settings affect translation & UI
🌐 LANGUAGE SETTINGS
自分の言語(母語)
JP 日本語
👥 参加者の言語(最大3つ)
JP 日本語 US English CN 中文 ES Español SA العربية RU Русский BR Português FR Français VN Tiếng Việt TH ไทย TR Türkçe BD বাংলা

「自分の言語」と「参加者の言語」について

1
「自分の言語」が翻訳方向を決定
「自分の言語」に設定した言語が翻訳の出力先になります。相手の発言はこの言語に翻訳されて表示・読み上げされます
2
「参加者の言語」をピル型で最大3言語選択
翻訳精度の最適化のため、参加者が話す可能性がある言語をあらかじめ選択します。(最大3言語)
3
4言語目を選ぼうとするとアラートが表示
「⚠️ 最大3言語まで選択できます」という警告が表示されます。精度を保つため、3言語を超えて選択することはできません
🎛️
3 つの動作モード
Modes determined automatically from your language selection
言語の選び方によって、Overtone は 3 つのモードを自動的に切り替えます。
🎯 単一言語モード (参加者の言語が 1 つ・自分の言語と異なる)
例: 自分=日本語、参加者=英語のみ。
高速応答(約 1〜2 秒)で、相手の発言を翻訳して表示します。シンプルな 1 対 1 会話に最適です。
🌐 多言語モード (参加者の言語が 2 つ以上)
1 つの会議内で言語が切り替わっても自動で判別し、発話者ごとに最適な翻訳先を切り替えます(コードスイッチング対応)。複数国籍の参加者が混在する会議に最適です。
📐 翻訳先の切り替えルール(v2.9.44 〜)
自分の言語=日本語、参加者の言語=日本語+英語 の場合:
・自分が日本語で話す → 英語 に翻訳(相手に届ける)
・参加者が英語で話す → 日本語 に翻訳(自分が理解する)
※ 「自分の言語」が参加者の言語に含まれる場合のみ、自分の発話だけ別言語に翻訳されます
⚠️ 3 言語以上を選択した場合の制限: 例えば日本語+英語+中国語を選ぶと、英語視聴者が中国語発言の日本語訳を読めない(逆も同様)といった制限があります。共有 Viewer は副次機能として位置付けており、全視聴者に最適な翻訳を届けたい場合は参加者全員が Overtone を利用する形態を推奨します。今後 Viewer 側の言語選択機能の追加を予定しています。
🌐 翻訳言語トグル(v2.9.208〜): 3 言語以上の場合、ヘッダーの 🌐 ボタンをタップすると、自分の発言をどの外国語に翻訳するかワンタップで切替できます。例: 日本語+英語+中国語の場合、英語に届けるか中国語に届けるかを発言ごとに選択可能。受信側(相手→自分)は影響を受けません。
📝 議事録モード (自分の言語=参加者の言語、1 つだけ)
例: 自分=日本語、参加者=日本語のみ。
翻訳は表示されず、原文の整形のみが記録されます。音声入力のクセや言いよどみを翻訳エンジンが整形して読みやすい議事録になります。社内会議の文字起こしに最適です。
💡
翻訳中に言語設定を変更する場合は、一度「戻る」で設定画面に戻ってください。
🌐
Understanding Language Settings
How language settings affect translation & UI
🌐 LANGUAGE SETTINGS
Your Language (Native)
JP 日本語
👥 Session Languages (MAX 3)
JP 日本語 US English CN 中文 ES Español SA العربية RU Русский BR Português FR Français VN Tiếng Việt TH ไทย TR Türkçe BD বাংলা

Your Language and Session Languages explained

1
"Your Language" determines translation direction
The language you set as "Your Language" becomes the output target. Your peer's speech is translated into this language for display and text-to-speech.
2
"Session Languages" — select up to 3 languages as pills/chips
Pre-select the languages your participants may speak — for optimal translation accuracy. (Up to 3 languages.)
3
Warning appears if you try to select a 4th language
A red alert badge displays: "⚠️ Maximum 3 languages can be selected". This limit ensures translation precision. You cannot exceed 3 languages per session.
📋 12 available languages for Session Languages
JP Japanese • US English • CN Chinese • ES Spanish • SA Arabic • RU Russian • BR Portuguese • FR French • VN Vietnamese • TH Thai • TR Turkish • BD Bengali
🎛️
Three Operating Modes
Auto-selected from your language choices
Overtone automatically switches between three modes based on your language selection.
🎯 Single-Language Mode (one participant language, different from yours)
Example: You = Japanese, participant = English only.
Fast response (~1-2s). Translates the other side's speech into your language. Ideal for 1-on-1 conversations.
🌐 Polyglot Mode (two or more participant languages)
Automatically detects language switches within a single meeting and routes each utterance to the optimal target (code-switching support). Best for multinational meetings.
📐 Per-utterance routing rule (v2.9.44+)
Your language = Japanese, participants = Japanese + English:
・You speak Japanese → translated to English (delivered to others)
・Participant speaks English → translated to Japanese (so you understand)
※ Only when "your language" is one of the participant languages, your own speech is translated to the lingua franca (English preferred).
⚠️ Limitation when 3+ languages are selected: e.g. ja+en+zh — English viewers cannot read the Japanese translation of Chinese speech (and vice versa). The shared Viewer is a secondary feature; for the best experience across all viewers, we recommend all participants use Overtone. Per-viewer language selection is planned for a future release.
📝 Minutes Mode (your language = single participant language)
Example: You = Japanese, participant = Japanese only.
Translations are not shown — only the cleaned-up original text is recorded. Hesitations and recognition artifacts are polished into readable minutes. Ideal for internal meeting transcription.
💡
To change language settings during translation, tap "Back" to return to the setup screen.
5
STEP 04

音声デバイスを設定するConfigure Audio Devices

Audio Device Configuration — 3-Step Setup
🖥
会議音声キャプチャ元
Meeting Audio Capture Source

画面共有で会議音声をキャプチャ

1
「🖥 画面共有を開始」ボタンをクリック
共有対象を選ぶダイアログが表示されます
2
音声を出力するアプリケーション(例:Teams)のウィンドウを選択し、「音声を共有」にチェック ✅
「音声を共有」をONにしないと相手の声がキャプチャされません
3
スペクトラムグラフで音声が入力されていることを確認
相手が話すとスペクトラムグラフが動きます。動かない場合は「音声を共有」がONか確認してください
共有する内容を選択 Teams Microsoft Teams 音声を共有 共有 重要!
「音声を共有」のチェックを忘れると、翻訳対象の音声がキャプチャされません
🎤
② 自分のマイク
プルダウンから使用するマイクデバイスを選択します。

※ ノイズキャンセリングヘッドフォン推奨
🔊
③ 再生先
翻訳音声の再生先デバイスを選択します。

※ ヘッドフォン推奨
📊
音声確認:翻訳スタート後、画面のスペクトラムグラフで会議音声がキャプチャされているか視覚的に確認できます。
🖥
Meeting Audio Source
Capture your meeting audio via Screen Share

Capture Meeting Audio via Screen Share

1
Click the "🖥 Start Screen Share" button
A dialog will appear asking what to share
2
Select the application window playing audio (e.g. Teams) and check "Share audio" ✅
Without "Share audio" checked, your peer's voice will not be captured
3
Verify audio input via the spectrum graph
The spectrum graph will animate when your peer speaks. If it doesn't move, check that "Share audio" is enabled
Choose what to share Teams Microsoft Teams Share audio Share KEY!
⚡ If you forget to check "Share audio", your peer's voice will not be captured for translation.
🎤
② My Microphone
Select your microphone device from the dropdown.

※ Noise-cancelling headphones recommended
🔊
③ Output Device
Select the speaker/headphone where translated audio will play.

※ Headphones recommended for best experience
💡 Input Test: Click "🎙 Input Test (5 sec)" to verify that meeting audio is being captured correctly before launching.
6
STEP 05

音声・詳細設定Voice & Advanced Settings

Voice Configuration & Advanced Settings
⚙️
Advanced Settings
詳細設定(通常はデフォルトでOK)
音声出力モード (v2.9.42 〜 ヘッダー TTS トグルを統合)
🔇 ミュート
音声 OFF・テキストのみ表示
🔊 クリア音声
高品質・聞き取りやすい合成音声
🎤 オリジナル音声
Standard+
自分の声色を自動再現
💡 v2.9.42 で UI を整理: 旧版でヘッダーにあった「TTS ON/OFF」ボタンは撤去されました。音声を OFF にしたい場合はこの画面で 🔇 ミュート を選択してください。1 つの操作で受信翻訳・PTT 自分発言の TTS が一括制御されます。
※ 会議開始後は音声出力モードがロックされます。変更は一度終了してから行ってください。
🗣 ボイス性別
自分の声
👨 男性 / 👩 女性
あなたが話したときの翻訳音声の声質
参加者の声
👨 男性 / 👩 女性
相手が話したときの翻訳音声の声質
💡 すべてのプランで利用可能 — 音声出力モードに依らず、TTS で再生される声の性別を選択できます。クリア音声・オリジナル音声どちらでも有効。
音声翻訳速度
1.0x
デフォルト
1.25x
1.5x
※ 翻訳音声の再生速度
カラースキーム
Modern
Vibrant
Calm
Pastel
High
Contrast
丸い色 = 自分の発言色 | 四角 = 相手の話者色
🚀
設定が完了したら「起動」ボタンをクリック! 翻訳画面に切り替わります。
⚙️
Advanced Settings
Defaults are fine for most users
Voice Output Mode (v2.9.42 — header TTS toggle removed)
🔇 Mute
Audio off, text only
🔊 Clear Voice
High-quality TTS audio
🎤 Original Voice
Standard+
Recreates your voice tone
💡 UI consolidated in v2.9.42: The legacy "TTS ON/OFF" toggle in the header has been removed. To turn audio off, select 🔇 Mute here. A single setting now controls TTS for both received translations and PTT self-speech.
※ Voice output mode locks once a meeting starts. End the session to change it.
🗣 Voice Gender
Your voice
👨 Male / 👩 Female
Voice tone for your translated speech
Other speaker's voice
👨 Male / 👩 Female
Voice tone for the other party's translation
💡 Available on all plans — Selects the TTS voice gender independently of voice output mode (Clear or Original).
Translation Speed
1.0x
Default
1.25x
1.5x
※ Translated voice playback speed
Color Scheme
Modern
Vibrant
Calm
Pastel
High
Contrast
🚀 When all settings are done, click "Launch" to start the translation screen.
7
STEP 05+

音声の種類とプランVoice Types & Your Plan

標準音声 / マイボイス / プレミアム音声 — どのプランで何が使えるか
🎙️
プランごとに使える音声
Voice options available on each plan
Overtone は 3 種類の音声を提供しています。プランに応じて利用できる音声が拡張されます。
音声 Trial / Starter Standard Premium
標準音声
男性 / 女性 / 自動 (発話者の性別を自動判定)
マイボイス (Voice Clone)
5 秒の事前録音であなた自身の声で翻訳
プレミアム音声
最上位の音質と表現力
💡 プラン変更時の挙動: アップグレードすると新しい音声がすぐに利用可能になります。ダウングレード時には上位音声が選択肢から消えますが、設定済みのマイボイスデータは保持され、再アップグレード時に即時復帰します。
🎤
マイボイス (Voice Clone) を設定する
5-second pre-recording — your own voice in any language
マイボイスは Standard / Premium プラン限定の機能です。設定画面でボイスクローン録音 UI が表示され、5 秒の音声サンプルから、あなた自身の声で翻訳音声を生成できます。
1
設定画面の「ボイスクローン録音」ボタンをタップ
Standard / Premium プラン契約後に表示されます (Trial / Starter プランでは非表示)
2
表示されるスクリプトをそのまま読み上げ
「私の声はクリアに伝わるか、真の意図が正確に伝わるか」(約 5 秒)。カラオケ風ハイライトで読みやすく表示
3
録音完了 → 即座にあなたの声で翻訳開始
音声モードセレクターに「✨ マイボイス」が追加され、ワンタップで切替可能
🔒 プライバシー: マイボイスデータは あなたの PC 内のみに暗号化保存 (AES-256-GCM)。Overtone のサーバには一切保存されません。退会時は当社が API ベンダー側のデータ削除も実行します。

💡 5 秒で完結: 録音は 1 度だけ。次回起動時から再録音不要で即利用できます。
🎙️
Which Voices Are on Which Plan
Voice options available on each plan tier
Overtone offers three voice types. Higher tiers unlock more voices.
Voice Trial / Starter Standard Premium
Standard Voice
Male / Female / Auto (gender auto-detected)
My Voice (Voice Clone)
5-second pre-recording — your own voice in any language
Premium Voice
Highest-quality, most expressive voice
💡 Plan-change behavior: Upgrading instantly unlocks new voices. Downgrading hides upper-tier voices but your My Voice data is preserved and re-activates instantly on re-upgrade.
🎤
Set Up My Voice (Voice Clone)
5-second pre-recording — your own voice in any language
My Voice is a Standard / Premium plan feature. Once on a qualifying plan, the Voice Clone recording UI appears in settings — record a 5-second sample, and translations play back in your own voice in any supported language.
1
Tap "Voice Clone Recording" in settings
Appears only on Standard / Premium plans (hidden on Trial / Starter).
2
Read the prompted script (≈5 seconds)
"Does my voice come through clearly — does my true intent land precisely?" Karaoke-style highlighting helps you read smoothly.
3
Done — translations now play in your own voice
"✨ My Voice" appears in the voice mode selector. One-tap switch.
🔒 Privacy: My Voice data is encrypted (AES-256-GCM) and stored only on your PC. Nothing is stored on Overtone servers. On account closure, we also trigger deletion at our upstream API vendor.

💡 One-time, 5-second setup: Record once. From the next launch, available instantly — no re-recording needed.
7+
STEP 06

翻訳画面の使い方Using the Translation Screen

Main Translation Screen — Real-Time Interface
LIVE ⏱ 56分⏱ 56min
📥 📤 🌐EN 🎤
📡 📱 💾
John 14:32:05
Hi everyone, let's discuss the project timeline.
皆さんこんにちは、プロジェクトのスケジュールについて話しましょう。
Maria 14:32:18
Sure, I think we need to adjust the deadline.
はい、期限を調整する必要があると思います。
自分Me 14:32:30
賛成です。2週間延長しましょう。
I agree. Let's extend it by two weeks.
🎤
トランシーバー方式Push-to-Talk
ボタン押下で日本語発言→リリースで翻訳送信Hold to speak → Release to translate
🎙
🖥 画面要素の説明
LIVE ピル(左上のステータス)
アプリの状態を一目で確認。緑[ ● LIVE ]=稼働中、灰[CONNECTING]=接続中、オレンジ[REC]=発話中、青[TRANSLATING]=翻訳中、橙[RECONNECT]=再接続中。
💬
翻訳チャットログ
相手の発言(原文+翻訳)と自分の発言が時系列で表示されます。話者ごとに色分けされます。
📥
受信音声 ON/OFF
相手の発言をAI音声で読み上げるか切替。ON時はシアン色で強調表示されます。
📤
送信音声 ON/OFF
自分の発言を翻訳後にAI音声で相手に届けるか切替(既定 ON)。
🌐
翻訳言語トグル
参加者の外国語が複数(EN/ZH 等)あるとき、自分の発言をどの言語に翻訳するかワンタップで切替。
🎤
マイク(自分の音声)
自分のマイク。一時停止時はソフトレッドで斜線が表示され、すぐに分かります。Ctrl+Shift+M でも切替可。
💾
CSV エクスポート
翻訳履歴を CSV ファイルとしてダウンロードします。会議後の議事録作成に便利です。
📡
Viewer 共有 / 📱 Companion View
📡 別画面で翻訳テキストを共有(Viewer)。📱 スマホで翻訳を受信(Companion View)。
🖥 Screen Elements
LIVE Pill (top-left status)
See app state at a glance. Green [● LIVE] = running, gray [CONNECTING], orange [REC] = speaking, blue [TRANSLATING], amber [RECONNECT] = reconnecting.
💬
Translation Chat Log
Shows your counterpart's speech (original + translation) and your own speech in chronological order. Color-coded by speaker.
📥
Receive Audio ON/OFF
Toggle AI voice playback of others' translated speech. Highlighted cyan when ON.
📤
Send Audio ON/OFF
Toggle whether your translated speech is delivered to others as AI voice (default ON).
🌐
Translation Language Toggle
When two or more foreign languages are selected (EN/ZH etc.), tap to switch which language your speech is translated into.
🎤
Microphone (your voice)
Your mic. When paused, shown in soft red with a slash for immediate visibility. Also toggled with Ctrl+Shift+M.
💾
CSV Export
Download translation history as CSV. Handy for post-meeting minutes.
📡
Viewer Share / 📱 Companion View
📡 share translation in another screen (Viewer). 📱 receive translation on mobile (Companion View).
8
STEP 07

自分の発言を翻訳するTranslate Your Own Speech

Transceiver Mode — Push-to-Talk Translation
🎙
トランシーバー方式で発言する
Push-to-Talk: Hold → Speak → Release → Translate

操作手順

1
🎤ボタンを長押し(マウスを押し続ける)
ボタンが赤く光り、録音状態になります
2
日本語で発言する
はっきりと話してください。ボタンを押している間だけ録音されます
3
ボタンを離す
AI 翻訳エンジンが自動翻訳 → 翻訳テキストがチャットに表示されます
4
音声出力がONなら、相手の言語で音声再生
翻訳された音声が自動的に再生されます(要TTS ON)
💡 翻訳の流れ
🎤 日本語で発言 🧠 翻訳 💬 テキスト表示 🔊 音声再生
待機中 🎤 タップで録音開始 録音中 🎤 離すと翻訳開始
📌 発言時のポイント
推奨 短い文で区切って話す。
1回のボタン押しで1〜2文が最適。
はっきり・ゆっくり話す。
避けること ボタンを押したまま長文を話し続ける。
早口で話す。
相手の発言中に同時にボタンを押す。
🆕 v2.9.42: 自分の発言は常時自動で取得・記録されます
議事録への完全記録と Viewer 共有時の翻訳のため、自分のマイクは常時 ON で発話検出されます。テキスト翻訳のみで実行され、音声合成 (TTS) は再生されません (会議中のハウリング防止)。
🛡️ プライバシー保護 (ZDR ポリシー)
・取得した音声は 翻訳テキスト生成にのみ使用 され、AI 学習には未使用 (全 AI ベンダーと学習未使用契約を締結済み)
・セッション終了時に音声バッファは自動破棄
・議事録 PDF / CSV にも翻訳テキストのみ保存 (音声ファイルは保存されません)
・常時起動マイクが ON のときは画面に「録音中」インジケーターが表示されます
🎤 PTT (トランシーバーボタン) — 補助機能
画面下のマイクボタン (or F9 キー) を押している間は 音声合成 (TTS) で自分の発言の翻訳を再生します (発音確認・翻訳妥当性確認用)。利用者が PC スピーカーに切替えれば、相手のマイクで拾わせて届ける「アナログ音声ループ」も可能 (緊急時の選択肢)。
⌨️ PTT キー (任意キー指定可): 設定画面 ▸ Advanced ▸ ⌨️ PTT キー ボタンをクリックして好きなキーを設定できます。デフォルトは F9
修飾キーとの組合せも可: Ctrl+Space / Alt+` / ScrollLock 等。ゲーマー向けに自由なキーマップが可能。
Esc キャンセル: キャプチャ中に Esc を押すと変更を取り消し。
「🔇 無効」ボタン: PTT キーボードショートカットを完全に無効化。
「↺ 既定」ボタン: F9 にリセット。
使えないキー: F5/F12/Tab/Enter/Backspace 等 (ブラウザ予約キー) と、文字キー単独 (a-z) は登録不可。Ctrl/Alt と組合せれば登録可能です。
・テキスト入力中は誤発火を防ぐため自動的に無効化されます。
🎙
Push-to-Talk: Speak in Transceiver Mode
Hold → Speak → Release → Translate

How to use

1
Hold the 🎤 button (press and hold)
The button turns red and recording begins
2
Speak in your language
Speak clearly. Recording continues only while the button is held.
3
Release the button
AI engine auto-translates → translated text appears in chat
4
If voice output is ON, audio plays in their language
Translated speech plays automatically (requires voice output ON)
💡 Translation flow
🎤 Speak 🧠 Translate 💬 Text 🔊 Audio
Standby 🎤 Hold to record Recording 🎤 Release → translate
📌 Speaking Tips
Do Speak in short sentences.
1–2 sentences per button press is ideal.
Speak clearly and at a moderate pace.
Avoid Holding the button and speaking long paragraphs.
Speaking too fast.
Pressing the button while your counterpart is speaking.
9
STEP 08

スマホで Companion ViewCompanion View on Mobile

Companion View — Real-Time Translation Text + Optional Audio on iPhone / Android
📱
iPhoneで翻訳音声を受信する
Listen to translated audio on your mobile device via headphones

セットアップ手順

● 待機中 BFF Enhanced DISPLAY WS:--- ⏱56分
📱 👇 ここをタップ! 🔇 OFF CSV 戻る
▲ PC翻訳画面のヘッダーバー。📱アイコンをタップするとQRコードが表示されます
1
PC側の翻訳画面で 📱 アイコンをタップ
ヘッダーバー右側の青いアイコンです。QRコードが画面に表示されます
2
iPhone / Android のカメラで QR コードを読み取る
iPhone は Safari、Android は Chrome で Companion View 画面が自動的に開きます
3
「タップして音声を有効化」ボタンをタップ
iOSの音声再生にはユーザー操作による許可が必要です
4
翻訳テキストがリアルタイムで届きます
PC側の翻訳が iPhone / Android にリアルタイム同期されます。音声 (TTS) はデフォルト OFF。受信機画面の「🔇 この端末: 音声 OFF」ボタンをタップすると、その端末でだけ AI 音声が再生されます (ホスト PC の音声設定とは独立)。
💡 v2.9.42 〜 デバイス別 TTS 制御に変更: 旧版ではホスト PC のヘッダー TTS トグルが受信機の音声も支配していましたが、現在は 受信機ごとに独立した ON/OFF トグルを持ちます。例えば「PC は静かに使いたい (ミュート) / iPhone でだけ翻訳音声を聞きたい (ON)」といった運用が可能。

🤖 Android 対応 (v2.9.42 新規): Chrome ブラウザで同じ受信機画面を開けば iPhone と同等に動作します。BT ヘッドセットの音声出力に対応。Pixel / Galaxy 等で動作確認推奨。
STEP 1: PCにQR表示
バッジタップ → QR表示
STEP 2: iPhoneで読取
接続中... 🔊 音声出力 ON カメラで読取 → 自動接続
📱 iPhoneにアプリのインストールは不要。ブラウザだけで動作します
🎧
利用シーン
英語のストリーミング配信などを同時通訳のように音声で聞くことができます。
🔄
使い分け例
会議の画面はPCで表示し、iPhoneで翻訳テキストの表示と翻訳音声を再生することができます。
📱
Listen to Translated Audio on iPhone
Real-time translation audio via headphones — no app install needed

Setup steps

● Standby BFF Enhanced DISPLAY WS:--- ⏱ 56min
📱 👇 Tap here! 🔇 OFF CSV Back
▲ PC translation screen header. Tap the 📱 icon to show QR code.
1
On the PC translation screen, tap the 📱 icon
The blue icon on the right side of the header bar. A QR code will appear on screen.
2
Scan the QR code with your iPhone or Android camera
Companion View opens in Safari (iOS) or Chrome (Android)
3
Tap "Tap to enable audio" button (only when you want audio)
iOS / Android both require a user gesture to allow audio playback
4
Translation text streams in real time
PC translations sync to mobile instantly. Audio (TTS) is OFF by default. Tap the "🔇 This device: Audio OFF" button on the receiver to enable AI audio playback for that device only (independent of the host PC's audio settings).
💡 Per-device TTS control (v2.9.42): Each receiver has its own ON/OFF toggle. Example workflows: "Mute on PC, audio on iPhone" or "Audio on Android, mute on PC" are now possible — useful for multitasking.

🤖 Android support (new in v2.9.42): Open the same listener URL in Chrome on Android (Pixel, Galaxy, etc.). BT headset output is supported. Functional parity with iOS Safari.
STEP 1: Show QR on PC
Badge tap → QR shown
STEP 2: Scan with iPhone
Connecting... 🔊 音声出力 ON Scan → auto-connect
📱 No app installation required on iPhone — works entirely in the browser (Safari).
🎧
Use Case
Listen to English streaming content or live events with simultaneous AI translation through your headphones.
🔄
Typical Setup
Display the meeting on PC, while your mobile device shows translated text and plays translated audio via headphones.
10
STEP 08+

Companion View の新機能Companion View — New Features

Cockpit Hybrid (発信/受信 分離) + Talk Playlist + ヘッダー診断バナー
🎛️
Cockpit Hybrid: 発信と受信を物理分離
Visually separate "My Voice" (outbound) from "Their Voice" (inbound) — never lose track of who is speaking
Companion View は 発信側 (自分の声)受信側 (相手の声) を画面の左右で分離する Cockpit Hybrid レイアウトを採用しています。
色も配色を分け、誰の発言か一目で判別できます。
🎤 MY VOICE / 発信
あなたの発言
Indigo (青紫) 系の配色。音声入力 → 翻訳 → 相手言語へ。
👂 THEIR VOICE / 受信
相手の発言
Slate (グレー) 系の配色。相手言語 → 自分の言語へ翻訳。
📥
📥 受信音声 ON/OFF (左ボタン)
相手の翻訳音声を Companion View で再生するかを切替。ヘッドホンで聞きたい場合に ON。
📤
📤 送信音声 ON/OFF (右ボタン)
自分の翻訳音声を会議に流すかを切替。Companion View では既定 OFF (デモ向け / 静かな環境向け)。
🎵
Talk Playlist: 翻訳キューを引き出し表示
Drawer-style queue for outbound/inbound utterances
Talk Playlist は 翻訳キューを引き出し (Drawer) 形式で表示する UI です。
ヘッダー左の ▸ ボタンでキューを開閉、字幕領域を最大 60% 確保したまま現在のキュー状態を把握できます。
📊 キューカウンター (v2.9.273 〜)
📤 送信 3
📥 受信 1
発信キューと受信キューを 独立カウント。順序混乱を防ぎます。
💡 v2.9.273 改善: Talk Playlist の余計な装飾 (区切り線) を削除し、UI 密度を上げました。最大 6 件のキューを一目で確認できます。
ヘッダー診断バナー: 残り時間 + バージョン
At-a-glance: app version + remaining session time with color thresholds
▼ Companion View ヘッダー診断バナー
v3.0.0-α.4 · ⏱ 残り 7h 24m

残り時間の色変化

通常表示: グレー (#94a3b8)
残り時間が 1 時間以上ある場合。安心して利用できます。
注意: 黄 (#fbbf24)
残り時間が 1 時間以下になると黄に変化。プランアップグレード or 翌月リセットまでの目安。
🚨
警告: 赤 (#ef4444)
残り時間が 30 分以下で赤。会議中の場合は早めの対応を推奨。
🔄
Companion View 再接続について (v3.0.0-α.2 〜)
サーバ再起動後でも Companion View からの再接続が可能になりました。会議中にネットワークが瞬断しても、URL をリロードするだけで 同じセッションに復帰できます。
※ セッションは 24 時間で自動失効します。長時間会議の途中で「セッションが見つかりません」と表示された場合は、PC 側の翻訳画面で QR を再表示してから再接続してください。
🎛️
Cockpit Hybrid: My Voice vs Their Voice
Physically separate outbound and inbound — never confuse who said what
Companion View splits outbound (My Voice) and inbound (Their Voice) visually with distinct color palettes.
At a glance, you always know who is speaking — and whose translation is playing.
🎤 MY VOICE
Your speech
Indigo palette. Mic → translate → delivered in their language.
👂 THEIR VOICE
Their speech
Slate palette. Their language → translated to yours.
📥
📥 Inbound audio ON/OFF (left button)
Toggle whether translated audio of their speech plays on the Companion device. Turn ON for headphones listening.
📤
📤 Outbound audio ON/OFF (right button)
Toggle whether your translated audio plays back. Default OFF on Companion View (demo / quiet environment).
🎵
Talk Playlist: Drawer-Style Translation Queue
Independent counters for outbound/inbound queue
Talk Playlist is a drawer-style queue UI. Tap the ▸ button on the left of the header to open/close. Preserves up to 60% of the screen for subtitles while still letting you see the queue state.
📊 Queue counters (since v2.9.273)
📤 Outbound 3
📥 Inbound 1
Outbound and inbound queues are counted independently — no ordering confusion.
💡 v2.9.273 polish: Removed decorative separators in Talk Playlist for higher UI density. Up to 6 queued items visible at once.
Header Status Banner: Version + Remaining Time
At-a-glance: version + remaining session minutes with color thresholds
▼ Companion View status banner
v3.0.0-α.4 · ⏱ 7h 24m left

Remaining time color thresholds

Normal: Gray (#94a3b8)
More than 1 hour remaining. You can relax.
Caution: Yellow (#fbbf24)
Less than 1 hour remaining. Time to consider upgrading or wait for monthly reset.
🚨
Warning: Red (#ef4444)
Less than 30 minutes remaining. Act fast if you're mid-meeting.
🔄
Companion View reconnection (since v3.0.0-α.2)
Reconnect after server restart is now supported. If the network drops mid-meeting, simply reload the URL to rejoin the same session.
※ Sessions auto-expire after 24 hours. If you see "Session not found" during a long meeting, re-show the QR on your PC and reconnect.
10+
STEP 09

翻訳ビューアー(Translation Viewer)Translation Viewer

Share Real-Time Translation Text with Meeting Participants
📡
Share Live Translations in Real Time
Translation Viewer — read-only live view for meeting participants

Overview

Translation Viewer lets you share your live translation screen with other meeting participants in real time.
Viewers need no app install or login — they simply open a URL in any browser to see translation text.
Available on Standard plan and above.

How to Use

1
Click the "📡 Share" button on the translation screen
Located in the header bar. Sharing starts and a QR code with URL is displayed
2
Share the URL or QR code with participants
Send via chat or let them scan the QR code. No need to be on the same network
3
Participants open the URL to see live translations
Fully synced with the host screen — speaker names, timestamps, original text, and translations are all shown
4
To stop sharing, click the "📡 Sharing" button again
Viewers see "Session ended" and are automatically disconnected
Host screen (left) → Viewer (right) synced in real time
Overtone GARY Good evening, everyone. GARY I'm Gary Shapiro. Host PC SYNC Translation Viewer GARY Good evening, everyone. GARY I'm Gary Shapiro. Participant's device
💡 Tips
・Viewers need no login — just open the URL
・Works on smartphones, tablets, and PCs — any browser
・No need to be on the same Wi-Fi — any internet connection works
・When the host stops sharing, viewers are automatically disconnected
📡
翻訳テキストをリアルタイムで共有する
Share live translation text with meeting participants

機能概要

翻訳ビューアーは、翻訳画面の内容をリアルタイムで他の参加者に共有する機能です。
閲覧者はアプリのインストールやログインなしに、ブラウザでURLを開くだけで翻訳テキストを確認できます。
Standardプラン以上でご利用いただけます。

使い方

1
翻訳画面で「📡 共有」ボタンをクリック
ヘッダーバー右側のボタンです。共有が開始され、QRコードとURLが表示されます
2
URLまたはQRコードを参加者に共有
チャットでURLを送信するか、QRコードをスキャンしてもらいます。同じネットワークでなくてもOKです
3
参加者がURLを開くと翻訳テキストがリアルタイムで表示されます
ホスト画面と完全に同期。話者名、タイムスタンプ、原文、翻訳文がすべて表示されます
4
共有を停止するには「📡 共有中」ボタンを再度クリック
閲覧者の画面に「セッション終了」と表示され、自動的に切断されます
ホスト画面(左)→ ビューアー(右)にリアルタイム同期
Overtone GARY 皆さん、こんばんは。 GARY 私はゲイリー・シャピロです。 ホスト PC SYNC Translation Viewer GARY 皆さん、こんばんは。 GARY 私はゲイリー・シャピロです。 参加者のスマホ / PC
💡 ポイント
・閲覧者はログイン不要。URLを開くだけで利用可能
・スマートフォン、タブレット、PCなど任意のブラウザで閲覧可能
・同一ネットワーク(Wi-Fi)でなくてもインターネット接続があればOK
・ホストが共有を停止すると、閲覧者側は自動的に切断されます
11
SECTION 02

トラブルシューティング & FAQTroubleshooting & FAQ

Troubleshooting & Frequently Asked Questions
🔴 翻訳が開始されない(相手の声が認識されない) 🔴 Translation won't start (peer voice not recognized)
画面共有時に「音声を共有」をONにしたか確認してください。
また、ヘッダーの WS: ✅ が表示されているか確認してください。❌ の場合はサーバーへの接続が切れています。「戻る」→再度「起動」で再接続できます。
When using Screen Share, make sure "Share audio" is enabled in the browser dialog.
Also check that the header shows WS: ✅. If it shows ❌, the server connection is lost — click "Back" then "Start" again to reconnect.
🟡 翻訳テキストは表示されるが音声が再生されない 🟡 Text appears but audio won't play
ヘッダーの音声出力ボタンが 🔊 ON になっているか確認してください。
また、③再生先デバイスが正しく設定されているか確認してください。ブラウザのタブがミュートになっていないかも確認が必要です。
Check that the voice output button in the header shows 🔊 ON.
Also verify that ③ Output Device is correctly set in Setup. Make sure the browser tab is not muted (check the tab icon or browser audio mixer).
🟠 「VOICE CONFIGURATION」が表示されない 🟠 "VOICE CONFIGURATION" panel is missing
Voice Configuration は自動管理されるようになりました。オリジナル音声モードを使用するにはStandard プラン以上が必要です。その他のプランでは、裏側で自動的に最適な翻訳音声(男性/女性)が適用されるため、設定パネル自体が非表示になります。 Voice Configuration is now auto-managed. Using Original Voice mode requires Standard plan or above. On other plans, the optimal translation voice (male/female) is applied automatically, so the panel is hidden.
🔵 トランシーバーボタンを押しても反応がない 🔵 Push-to-Talk button not responding
②自分のマイクが正しく選択されているか確認してください。
ブラウザのマイク許可が「許可」になっていることも確認してください(URL横の鍵アイコンから確認可能)。
Check that ② My Microphone is correctly selected in Setup.
Also confirm that the browser has microphone permission set to "Allow" (click the lock icon next to the URL to check).
🟣 翻訳精度を上げるには? 🟣 How to improve translation accuracy?
音声翻訳エンジンは最適なパフォーマンスのために自動的に構成されています。
相手が静かな環境で話しているほど音声翻訳の認識精度が向上します。自分の発言時は短文で区切ると翻訳精度が上がります。
The voice translation engine is automatically configured for optimal performance.
A quieter environment improves recognition accuracy. When using Push-to-Talk, speaking in shorter sentences also helps improve translation quality.
🔷 「音声出力モード」がロックされている 🔷 "Voice Output Mode" is locked
アクティブな会議中は音声出力モードが自動的にロックされます。これは正常な動作です。音声出力モードを変更するには、セットアップ画面に戻る必要があります。会議を一度終了して、セットアップ画面で設定を変更してから、再度会議を開始してください。 Voice Output Mode is automatically locked during active meetings. This is normal behavior. To change the voice output mode, you need to return to the Setup screen. End the current meeting, change settings on the Setup screen, then start a new meeting.
🌐 1つの会議で複数言語を使えますか? 🌐 Can I mix multiple languages in one meeting?
はい。参加者の言語を 2 つ以上選択すると自動的に「多言語モード」になり、会議中に英語→中国語→日本語のように切り替わっても自動で判別して翻訳します(コードスイッチング対応)。事前に言語を切り替える操作は不要です。 Yes. Select 2 or more participant languages and Polyglot Mode is auto-enabled. The app detects language switches within a single meeting (e.g. English → Chinese → Japanese) and translates each utterance correctly. No manual switching needed.
📝 翻訳が表示されず原文だけが出ます 📝 Only the original text appears, no translation
議事録モードで動作している可能性があります。自分の言語と参加者の言語が同じ(例: 両方とも日本語)の場合、翻訳は不要なため原文の整形のみを記録する設計です。これは社内会議の議事録作成に最適です。翻訳が必要な場合は、参加者の言語に自分と異なる言語を追加してください。 You may be in Minutes Mode. If your language matches the participant language (e.g. both Japanese), translation is unnecessary so the app records only the cleaned-up original text. This is ideal for internal meeting minutes. To enable translation, add a participant language different from yours.
🌍 英語の発言が違う言語として認識される 🌍 English speech is recognized as a different language
音声認識は人間の発音を 100% 正確に判別できないため、たまに似た音の他言語として認識されることがあります(特に短い相づちや音響的にあいまいな区間)。参加者の言語に英語を含めると判別精度が改善します。それでも誤認識が頻発する場合は、マイク音量や会議音声のクリアさを確認してください。 Speech recognition is not 100% accurate and may occasionally identify English as a phonetically similar language (especially short utterances or acoustically ambiguous regions). Including English in the participant language list improves detection. If misidentification persists, check microphone volume and audio clarity.
⏱ 翻訳が一瞬遅くなることがあります ⏱ Translation occasionally lags
短時間に大量の発言が連続すると、サービスの利用上限に達して翻訳が一時的に遅くなる場合があります。その場合は自動的に代替経路に切り替わるため、翻訳自体は継続します。連続して頻発する場合は会議を一度終了して再開してください。 If many utterances occur in rapid succession, the translation service may temporarily slow down due to rate limits. The app automatically switches to a fallback route so translation continues. If it persists, end the meeting and restart.
⚡ クイックリファレンス — LIVE ピル 7 状態 ⚡ Quick Reference — LIVE Pill 7 States
画面左上の LIVE ピルは、アプリの状態を 1 つのピル UI に統合して表示します。色とラベルで状態を識別できます。 The LIVE pill in the top-left integrates the app's status into a single UI element. State is identified by color and label.
IDLE 起動前(待機)Pre-launch (idle)
CONNECTING 接続中Connecting
LIVE 稼働中(通常)Running (normal)
REC マイク録音中Mic recording
TRANSLATING 翻訳処理中Translating
RECONNECT 再接続中(要待機)Reconnecting (wait)
ERROR エラー(再起動推奨)Error (restart recommended)
OFFLINE 停止中Stopped
12
APPENDIX A

上級者向け - 自分の発言の音声配信Advanced — Send Your Translated Voice to the Other Party

Power User Setup with VoiceMeeter Banana + MacroButton
⚠️ 上級者向けの構成です
本 Appendix は Windows + 別ベンダーソフトウェアの導入 を前提とします。Overtone のメインフロー (画面音声を翻訳して字幕表示) は本 Appendix 不要で完結します。「自分の日本語発言を英訳して相手の会議ツールに音声で届けたい」 場合のみ参照してください。社内規定で外部ソフトのインストールが禁止されている場合は使用できません。
💡 v2.9.146-150〜 新方式 (推奨): 画面共有音声経由で自分の発言を相手に届ける新方式が標準実装されました。ヘッダーの 📤 送信音声 ON/OFF トグルで切替できます。VoiceMeeter Banana / MacroButton の導入は不要です。本 Appendix の方法は、より細かい制御をしたい上級者・VoiceMeeter 既存ユーザー向けの代替手段としてご参照ください。

A.1 概要 — 想定シーン

🎯 シナリオ ① (本 Appendix で対応)
英語が話せないあなたが、英語話者の会議に参加する場面。
F9 を押している間に日本語で話すと、自動で英訳音声が会議ツール経由で相手に届きます。
F9 を押していない間にあなたが発言した音声は、そのまま相手に届きます。
🎯 シナリオ ② (今後対応予定)
日本語話者と英語話者が同時に複数人参加し、相手側に「日本語の生音声 + 英訳の音声」両方を届ける同時通訳的な使い方。
現状の Power User Setup でも一部実現可能ですが、参加者全員が Overtone を利用する形態で本格対応予定です。

A.2 必要なもの

項目 必須/推奨 備考
Windows PC (10 / 11)必須macOS / Linux は VoiceMeeter 非対応
VoiceMeeter Banana (無料)必須vb-audio.com からダウンロード
Windows 管理者権限必須仮想オーディオドライバのインストールに必要
USB / 有線ヘッドセット推奨Bluetooth ヘッドセットだと音声品質が落ちます (HFP プロファイル制約)
会議ツール (ブラウザ版)推奨Teams Web / Google Meet 等。デスクトップアプリは音声キャプチャ制限のため非推奨

A.3 音声経路図

音声経路図 — F9 押下状態による経路切替 凡例常時アクティブ経路F9 押下中のみF9 押下中は遮断 2 つの状態F9 OFF: 日本語生音声 → 相手F9 ON: 英訳 TTS → 相手 📱 利用者 PC (Windows) 🎤 マイクヘッドセットUSB / 有線接続 推奨 🎚 VoiceMeeter Banana (音声ミキサー) Strip 1Hardware Input 1(物理マイク受信)▶ A1: OFF▶ B1: ONMute = MacroButton 制御 Strip 5 (AUX)Voicemeeter Aux Input(Overtone TTS 受け口)▶ A1: ON▶ B1: ON A1 出力→ ヘッドホン B1 仮想出力→ 会議ツール マイク ⌨️ MacroButton (F9 連動)F9 ON → Strip[0].Mute = 1; (物理マイク遮断)F9 OFF → Strip[0].Mute = 0; (物理マイク復帰)⚠️ OFF 側を 0 にしないと mute が固まる 📌 全 5 経路の整理:① Strip 1→B1: 日本語生音声② Strip 5→A1: 自分で英訳確認③ Strip 5→B1: 相手に英訳届く④ MacroButton: ①の mute 制御⑤ Overtone STT: getUserMedia 直接 🌐 Overtone(Chrome タブ)STT + 翻訳 + TTS 🎧 ヘッドホンスピーカー利用者の確認用 📞 会議ツール(ブラウザ版 推奨)マイク = B1 仮想出力 👥 相手 PC 📞 会議ツール受信側日本語 or 英訳を受信 🔊 相手のスピーカーPC 内蔵 / ヘッドホン音声を耳で聞く 物理音声 F9 中: STT 用録音 (getUserMedia) 英訳 TTS ②自分で英訳確認 ①日本語 (F9 OFF) or③英訳 TTS (F9 ON) インターネット(Opus 圧縮) 受信音声を再生

A.4 セットアップ手順

A.4.1 VoiceMeeter Banana のインストール

  1. vb-audio.com から VoiceMeeter Banana をダウンロード
  2. インストーラを管理者権限で実行
  3. 必ず PC を再起動 (仮想オーディオドライバの登録に必要)
  4. 再起動後、VoiceMeeter Banana を起動
  5. Menu → System Tray (Run at Startup) にチェックして自動起動を有効化

A.4.2 VoiceMeeter ストリップ設定

項目 (UI 表記)設定値
Stereo Input 1 (左上のデバイス選択)WDM: ヘッドセット マイク
※ Bluetooth デバイス (AirPods 等) は MME を選択
HARDWARE OUT A1 (右上のデバイス選択)WDM: ヘッドホン (出力先)
※ Bluetooth デバイス (AirPods 等) は MME を選択
Stereo Input 1 ▶A1OFF (sidetone 防止)
Stereo Input 1 ▶B1ON (Teams へ)
Voicemeeter AUX (VIRTUAL INPUTS、右側 2 番目) ▶A1ON (自分で英訳確認)
Voicemeeter AUX (VIRTUAL INPUTS、右側 2 番目) ▶B1ON (相手に英訳届く)
💡 ドライバ種別 (WDM / MME / KS / ASIO) の選び方
VoiceMeeter のデバイス選択画面で、左側に WDM (WASAPI) / KS / MME / ASIO の 4 種類のドライバ種別が表示されます。デバイスの種類で使い分けてください:
  • USB ヘッドセット (INZONE Buds USB ドングル等)WDM 推奨 (低レイテンシ、安定)
  • Bluetooth ヘッドセット (AirPods 等)MME 必須 (WDM だと 0x88890008 エラーで起動失敗)
  • 有線ヘッドセット / 内蔵スピーカー / 内蔵マイクWDM 推奨
  • VB-Cable (仮想)WDM または MME いずれも可
※ AirPods のサンプルレートはマイク入力 16000 Hz / 出力 44100 Hz と非対称のため、WDM 厳密モードを通らず MME (互換モード) で受け流す必要があります。

A.4.3 MacroButton 設定 (F9 で物理マイクをミュート)

  1. VoiceMeeter Banana 起動と同時に MacroButtons アプリも起動 (タスクトレイに常駐)
  2. MacroButtons 画面で 任意の青いボタンを右クリック
  3. Button Configuration ダイアログで以下を入力:
項目設定値
Button NameOvertone (任意)
Button TypePush Button
Keyboard ShortcutF9 key (Overtone PTT キーと一致)
Exclusive KeyOFF (重要: チェックなし)
→ ON にすると Overtone に F9 が伝わらず PTT 録音されません
Request for Button ON / Trigger INStrip[0].Mute = 1;
Request for Button OFF / Trigger OUTStrip[0].Mute = 0;
⚠️ 必ず = 0; にすること。= 1; のままだと mute が固まります

A.4.4 Overtone 設定

項目設定値
自分のマイクヘッドセット マイク (物理デバイス)
再生先Voicemeeter Aux Input (VB-Audio Voicemeeter VAIO)
PTT キーF9 (MacroButton と一致)
PTT モード🎤 押している間 または 🔁 トグル

A.4.5 会議ツール設定 (ブラウザ版推奨)

項目設定値
マイクVoicemeeter Out B1 (VB-Audio Voicemeeter VAIO)
スピーカーヘッドホン (相手の声を聞く)

A.5 動作確認

  1. 会議ツール (Teams Web / Google Meet 等) で会議に参加
  2. F9 押下なし: 「あー、はい」など日本語で発話 → 相手に 日本語の生音声が届く ✓
  3. F9 押下中: 日本語で発話 (例: 「来週の納期を確認したい」) → F9 を離す
  4. VoiceMeeter Strip 1 の Mute ボタンが F9 押下中だけ赤く点灯することを確認 ✓
  5. 2-5 秒後、ヘッドホンから英訳音声が聞こえる ✓
  6. 同時に 相手にも英訳音声が届くことを確認 ✓

A.6 トラブルシューティング

症状原因 / 対処
F9 を押していない時に相手に音声が届かないMacroButton の Trigger OFF が Strip[0].Mute = 1; のまま (誤設定) → = 0; に修正。VoiceMeeter Strip 1 の Mute ボタンが赤く固まっていたら手動でクリックして解除
F9 を押しても物理マイクがミュートされないMacroButtons アプリがタスクトレイで動作中か確認 / Trigger キーが F9 か確認 / Exclusive Key が OFF か確認
F9 を押しても Overtone で録音されないExclusive Key が ON になっていると Overtone に F9 が伝わらない → OFF に変更
英訳音声がヘッドホンで聞こえないStrip 5 (AUX) の ▶A1 が ON か確認 / Overtone の再生先が Voicemeeter Aux Input か確認
英訳音声が相手に届かないStrip 5 ▶B1 が ON か確認 / 会議ツールマイクが Voicemeeter Out B1 か確認
画面共有 (画面全体/ウィンドウ) でエラー (Device in use)VoiceMeeter Banana が WASAPI Loopback を保護しているため発生。会議ツールのブラウザ版を Chrome タブとして開き「Chrome タブ + タブの音声を共有」で回避
音声に歪みが出るBluetooth ヘッドセット使用時に発生 (HFP プロファイル制約)。USB / 有線ヘッドセットで改善 / 相手 PC のスピーカー音量を下げる / Strip 5 のレベルメーターが clipping していないか確認

A.7 制限事項と免責

  • Windows 限定: macOS / Linux では VoiceMeeter Banana が動作しません
  • 別ベンダー製品: VoiceMeeter Banana は VB-Audio 社の製品で、Overtone のサポート対象外です。導入トラブルは VB-Audio 社の公式ドキュメントを参照してください
  • 社内規定の確認: 業務 PC への外部ソフトウェアインストールが社内規定で禁止されている場合は使用できません
  • 音声品質: Bluetooth ヘッドセット使用時は音声帯域が制限されます (HFP プロファイル 8kHz)。重要な会議では USB / 有線推奨
  • 今後の正式実装予定: 本 Appendix の構成は現時点での暫定的な解決策です。今後 参加者全員が Overtone を利用する形態専用アプリ (仮想音声デバイス内蔵) による正式対応を計画しています
⚠️ Advanced Power User Setup
This appendix assumes Windows + third-party software installation. Overtone's main flow (translate meeting audio into subtitles) works without anything in this appendix. Refer to this only if you want to send your translated voice to the other party (e.g. you speak Japanese and the other party hears it in English). If your company prohibits installing external software, you cannot use this setup.

A.1 Overview — Use Cases

🎯 Scenario ① (covered by this appendix)
You don't speak English well and need to join a meeting with English speakers.
When you hold F9 and speak Japanese, your speech is automatically translated to English and delivered to the other party via the meeting tool.
When you don't hold F9, your raw voice flows directly to the other party as-is.
🎯 Scenario ② (planned for a future release)
Multiple Japanese and English speakers participate, and you want to deliver "raw Japanese voice + translated English voice" simultaneously to the other side, like a simultaneous interpretation setup.
Partially achievable with the current Power User Setup, but full support is planned via "all participants use Overtone" deployment.

A.2 What You Need

Item Required / Recommended Notes
Windows PC (10 / 11)RequiredVoiceMeeter is not available for macOS / Linux
VoiceMeeter Banana (free)RequiredDownload from vb-audio.com
Windows administrator privilegesRequiredRequired to install the virtual audio driver
USB / wired headsetRecommendedBluetooth headsets reduce audio quality (HFP profile constraints)
Meeting tool (browser version)RecommendedTeams Web / Google Meet etc. Desktop apps have audio capture restrictions

A.3 Audio Routing Diagram

Audio Routing — Path Switching by F9 (PTT) LegendAlways-active pathOnly when F9 is heldBlocked while F9 held Two statesF9 OFF: Raw Japanese → otherF9 ON: Translated TTS → other 📱 Your PC (Windows) 🎤 MicrophoneHeadsetUSB / wired recommended 🎚 VoiceMeeter Banana (audio mixer) Strip 1Hardware Input 1(physical mic input)▶ A1: OFF▶ B1: ONMute = controlled by MacroButton Strip 5 (AUX)Voicemeeter Aux Input(receives Overtone TTS)▶ A1: ON▶ B1: ON A1 output→ Headphones B1 virtual out→ meeting tool mic ⌨️ MacroButton (linked to F9)F9 ON → Strip[0].Mute = 1; (mute physical mic)F9 OFF → Strip[0].Mute = 0; (restore physical mic)⚠️ The OFF side must be 0 — otherwise mute gets stuck 📌 5 paths summary:① Strip 1→B1: raw Japanese voice② Strip 5→A1: hear your translation③ Strip 5→B1: deliver to other party④ MacroButton: mute control for ①⑤ Overtone STT: getUserMedia direct 🌐 Overtone(Chrome tab)STT + translation + TTS 🎧 HeadphonesSpeakersFor your confirmation 📞 Meeting tool(browser ver. recommended)Mic = B1 virtual out 👥 Other Party's PC 📞 Meeting toolReceiver sideReceives Japanese or English 🔊 Other party's speakersBuilt-in / headphonesHeard with their ears Physical audio F9 ON: STT recording (getUserMedia) English TTS ② Confirm your translation ① Japanese (F9 OFF) or③ English TTS (F9 ON) Internet(Opus codec) Plays received audio

A.4 Setup Steps

A.4.1 Install VoiceMeeter Banana

  1. Download VoiceMeeter Banana from vb-audio.com
  2. Run the installer with administrator privileges
  3. Restart your PC (required to register the virtual audio driver)
  4. Launch VoiceMeeter Banana after restart
  5. Enable auto-launch via Menu → System Tray (Run at Startup)

A.4.2 VoiceMeeter strip configuration

ItemSetting
Stereo Input 1 (top-left device selector)WDM: Headset Microphone
※ Use MME for Bluetooth devices (AirPods etc.)
HARDWARE OUT A1 (top-right device selector)WDM: Headphones (your output device)
※ Use MME for Bluetooth devices (AirPods etc.)
Stereo Input 1 ▶A1OFF (prevents sidetone)
Stereo Input 1 ▶B1ON (route to meeting tool)
Voicemeeter AUX (VIRTUAL INPUTS, 2nd from right) ▶A1ON (hear your translation yourself)
Voicemeeter AUX (VIRTUAL INPUTS, 2nd from right) ▶B1ON (deliver translation to other party)
💡 Choosing the audio driver type (WDM / MME / KS / ASIO)
In the VoiceMeeter device selection dialog, you can choose from WDM (WASAPI) / KS / MME / ASIO on the left side. Pick based on the device type:
  • USB headsets (e.g., INZONE Buds USB dongle)WDM recommended (low latency, stable)
  • Bluetooth headsets (e.g., AirPods)MME required (WDM fails with 0x88890008 error)
  • Wired headsets / built-in speakers / built-in micsWDM recommended
  • VB-Cable (virtual)WDM or MME both work
※ AirPods use asymmetric sample rates (16000 Hz mic input / 44100 Hz output), which fail WDM strict mode validation. MME (legacy compatibility mode) handles this gracefully.

A.4.3 MacroButton setup (mute physical mic with F9)

  1. Launch the MacroButtons app alongside VoiceMeeter Banana (it stays in the system tray)
  2. Right-click any blue button in the MacroButtons window
  3. In the Button Configuration dialog, fill in the following:
ItemSetting
Button NameOvertone (anything you like)
Button TypePush Button
Keyboard ShortcutF9 key (must match Overtone PTT key)
Exclusive KeyOFF (must remain unchecked)
→ If ON, F9 won't reach Overtone and PTT recording won't trigger
Request for Button ON / Trigger INStrip[0].Mute = 1;
Request for Button OFF / Trigger OUTStrip[0].Mute = 0;
⚠️ Must be = 0; — leaving it as = 1; will get the mute stuck

A.4.4 Overtone settings

ItemSetting
Your microphoneHeadset Microphone (physical device)
Output destinationVoicemeeter Aux Input (VB-Audio Voicemeeter VAIO)
PTT keyF9 (must match MacroButton)
PTT mode🎤 Hold or 🔁 Toggle

A.4.5 Meeting tool settings (browser version recommended)

ItemSetting
MicrophoneVoicemeeter Out B1 (VB-Audio Voicemeeter VAIO)
SpeakerHeadphones (to hear the other party)

A.5 Verification

  1. Join a meeting in the meeting tool (Teams Web / Google Meet etc.)
  2. Without F9: speak Japanese (e.g. "yes", "uh-huh") → other party hears your raw Japanese voice
  3. While holding F9: speak Japanese (e.g. "I'd like to confirm next week's deadline") → release F9
  4. Confirm the Mute button on VoiceMeeter Strip 1 turns red only while F9 is held
  5. 2-5 seconds later, the English translation plays through your headphones
  6. The same English translation reaches the other party at the same time ✓

A.6 Troubleshooting

SymptomCause / Fix
No audio reaches the other party when F9 is not heldMacroButton's Trigger OFF is still Strip[0].Mute = 1; (incorrect) → change to = 0;. If Strip 1's Mute button is stuck red, click it once to unmute
Pressing F9 doesn't mute the physical micCheck that MacroButtons is running in system tray / Trigger key is F9 / Exclusive Key is OFF
Pressing F9 doesn't trigger Overtone recordingIf Exclusive Key is ON, F9 doesn't reach Overtone → set to OFF
Translation audio not heard in your headphonesCheck that Strip 5 (AUX) ▶A1 is ON / Overtone output is set to Voicemeeter Aux Input
Translation doesn't reach the other partyCheck that Strip 5 ▶B1 is ON / Meeting tool's mic is Voicemeeter Out B1
Screen sharing (full screen / window) errors with "Device in use"VoiceMeeter Banana protects the WASAPI Loopback path. Open the meeting tool's browser version in a Chrome tab and use "Chrome tab + Share tab audio" to bypass
Audio sounds distortedCommon with Bluetooth headsets (HFP profile constraints). USB / wired headsets sound much cleaner. Also lower the receiver's speaker volume / check Strip 5 levels are not clipping

A.7 Limitations & Disclaimer

  • Windows-only: VoiceMeeter Banana is not available for macOS / Linux
  • Third-party software: VoiceMeeter Banana is a VB-Audio product and is not covered by Overtone support. Refer to VB-Audio's official documentation for installation issues
  • Check company policy: If your company prohibits installing external software on work PCs, you cannot use this setup
  • Audio quality: Bluetooth headsets reduce the audio bandwidth (HFP profile, 8kHz). Use USB / wired headsets for important meetings
  • Future official support: This setup is a temporary workaround at the time of writing. We plan to officially support "all participants use Overtone" deployment and a dedicated app (with built-in virtual audio device) in future releases
A

運営事業者 / 特定商取引法に基づく表記 / プライバシーポリシー / 利用規約 Operator Info / Specified Commercial Transactions Act Disclosure / Privacy Policy / Terms
overtone-translate.com/legal    privacy    terms
© 2026 Overtone合同会社 / Overtone LLC