OpenAI 周五在其官網(wǎng)上發(fā)表了博客文章,名為“駕馭合成聲音的挑戰(zhàn)和機(jī)遇”, 這也是 OpenAI 在官網(wǎng)首次展示了全新自定義音頻模型“Voice Engine”。
用戶只需要提供15秒左右的參考聲音,通過Voice Engine就能生成幾乎和原音一模一樣的全新音頻,在清晰度、語音連貫、音色、自然度等方面比市面上多數(shù)產(chǎn)品都強(qiáng)很多。
除了能合成音頻之外,OpenAI 還展示了Voice Engine很多其他際商業(yè)用途,例如,一位失去聲音表達(dá)能力的女孩,在Voice Engine幫助下能像以前一樣正常發(fā)音說話。
全文內(nèi)容:OpenAI 官網(wǎng)
Voice Engine 應(yīng)用場景:
1. 閱讀助手:可以通過自然且富有情感的聲音為非閱讀者和兒童提供閱讀輔助,實時個性化響應(yīng),與學(xué)生互動。
2. 內(nèi)容翻譯:可以翻譯視頻和播客等內(nèi)容,使創(chuàng)作者和企業(yè)能夠以流利且原汁原味的聲音觸達(dá)全球更多受眾。
3. 服務(wù)全球:改善偏遠(yuǎn)地區(qū)的必要服務(wù)。
4. 幫助言語障礙人士:為言語障礙人士提供治療應(yīng)用,以及為有學(xué)習(xí)需求的人士提供教育增強(qiáng)功能,使殘疾人能夠進(jìn)行交流。
5. 幫助病人恢復(fù)聲音:幫助患有突發(fā)性或退行性言語障礙的患者恢復(fù)聲音。