即便隨著技術的進步,語音合成的效果已經從早期電子字典、GPS導航系統等生冷的語音,進化為虛擬助理較為優美語調,但還是與真實人類的聲音有段落差,NVIDIA就靠著AI技術來縮短差距。
即便隨著技術的進步,語音合成的效果已經從早期電子字典、GPS導航系統等生冷的語音,進化為虛擬助理較為優美語調,但還是與真實人類的聲音有段落差,NVIDIA就靠著AI技術來縮短差距。
提供更真實的AI語音合成
由於人們說話的節奏、語調和音色都很複雜,都成為AI難以模仿的原因,而NVIDIA的研發團隊正致力於開發高品質且可控制的語音合成模型和工具,以重現真實人類豐富且有情感的聲音,這項技術除了可以應用於銀行、零售業等語音自動化客服系統,也可以應用在電玩中產生逼真的即時合成語音, NVIDIA的創意團隊甚至將它應用於The Power of AI系列影片的旁白。
另一方面,NVIDIA除了發表語音合成技術外,也包含自然語言處理、自動語音識別、關鍵字檢測、音訊增強等對話式AI相關技術,強化整體AI應用的多元性。
▲NVIDIA在展示影片中說明了AI語音合成的研究要點。
▲The Power of AI系列影片的旁白是由AI語音合成技術產生。
Interspeech 2021大會將匯集超過1,000名研究人員,展示多像語音技術方面的開創性成果,NVIDIA也會參加多場主題演說,更多詳細資料可參考NVIDIA at Interspeech 2021特設網站。
加入電腦王Facebook粉絲團