Seirenes TTS — 中文音質驗證 v2
2026-05-05 · 三 vocoder 對比 · ASR 客觀驗證 (Qwen3-ASR + OpenCC 繁簡正規化)
三 vocoder 整體 CER 比較
| TTS | 4 句純中文 CER | 中英混雜 CER | 狀態 |
| SirenaVoice ZipVoice + Vocos(舊) | 4.9% | —(未測) | 有痰音 ⚠️ |
| SirenaVoice ZipVoice + BigVGAN(新) | 2.4% | 0.0% | 清晰 ✨ |
| VibeVoice-Realtime-0.5B | 90.5% | — | 不支援中文 ❌ |
① BigVGAN vs Vocos — 同句直接 A/B 對照
1. 歡迎使用 Seirenes 智慧家居語音助理,請問需要什麼協助嗎?
5. Open the door please,順便關掉客廳的燈。(中英混雜)
② 進階 6 句 — 雙 prompt × 雙 vocoder 完整對照
4 欄:子睿 Vocos · 子睿 BigVGAN · 采芸 Vocos · 采芸 BigVGAN
6. 請打電話給張先生,他的電話是零九三七八八八九九九。
7. 提醒我明天下午三點要去開會,主題是 AI 產品設計。
8. 今天的股市表現如何?台積電漲了百分之二點五。
9. 請播放周杰倫的歌,特別是他二零零一年的專輯。
10. 我想預訂明天晚上七點的兩人座位,幫我訂忠孝東路的義式餐廳。
11. Open the door please,順便關掉客廳的燈。(中英混雜)
產生時間 2026-05-05 · 引擎 SirenaVoice ZipVoice-distill 122M (ONNX INT8)
· vocoder Vocos vs NVIDIA BigVGAN v2 24kHz 100band
· prompt 男聲 小男孩_子睿.wav / 女聲 台灣女主播_采芸.wav
· loudness norm I=-16 LUFS TP=-1.5
· ASR Qwen3-ASR-0.6B ONNX (INT8) on DGX :8100, OpenCC s2t 後計算 CER