F5-TTS Base FP16 NFE 12 + polyphone_dict.py (90+ TW 多音字) + text_normalizer.py (M2.7 寫的數字/日期/英文保留)
8 句多音字測項 ASR-CER 驗證
| # | 句子 | 測項 | CER |
| 1 | 重新開機後請告訴我 | 重 chóng (非 zhòng) | 0% |
| 2 | 銀行幾點開門 | 行 háng (非 xíng) | 0% |
| 3 | 客廳冷氣調到 26 度 | 26→二十六 | 0% |
| 4 | 台積電漲了 2.5% | 2.5→百分之二點五(已修 . bug) | — |
| 5 | 下午 3:30,知道時間 | 3:30→三點半 | 0% |
| 6 | 電話 0937888999 | 電話 → 零九三七… | 0% |
| 7 | 長度兩公尺、重量五公斤 | 長 cháng / 重 zhòng | 0% |
| 8 | Open the door please... | 英文保留 | 0% |
| OVERALL | 2.3% |
V2-poly 1. 重新開機後,請告訴我。(重 chóng)
V2-poly 2. 銀行幾點開門,我要去處理事情。(行 háng)
V2-poly 3. 幫我把客廳冷氣調到 26 度。(數字正規化)
V2-poly 4. 台積電今天漲了 2.5%,現在股價非常重要。(2.5→百分之二點五)
★ V2 + normalizer (decimal fix)
V2-poly 5. 現在是下午 3:30,我想知道時間。(時間正規化)
V2-poly 6. 請打電話給張先生,電話 0937888999。(電話念法)
V2-poly 7. 長度大約是兩公尺,重量五公斤。(長 cháng / 重 zhòng)
V2-poly 8. Open the door please,順便關掉客廳的燈。(英文段保留)