大家好,這里是和你們一起探索 AI 的花生~
前段時間看到我們的優(yōu)設微博主編@小胖分享了一款配音工具 TTSMaker(馬克配音),試了一下感覺非常不錯:它可以快速將文本轉(zhuǎn)換為語音,支持多種不同的音色,配音效果也很自然,還是免費的。不僅適合自媒體和視頻創(chuàng)作者,也可以用來處理日常辦公、學習中的相關(guān)需求。
我在全網(wǎng)搜索了一下有沒有同類工具,結(jié)果還真發(fā)現(xiàn)了不少,今天就做一期合集將其中比較好的一些推薦給大家。它們也都是免費的,并且打開即用非常方便,一起來看看吧~
相關(guān)推薦:
網(wǎng)站直達: https://ttsmaker.cn/
TTSMarker 是一款免費的文本轉(zhuǎn)語音網(wǎng)站,它有 50 多款不同的人物音色,支持中文、英語、日語、韓語、西班牙與等 50 多種語言,還支持粵語、四川方言、東北方言、臺灣腔等具有地方特色的語言配音。TTSMarker 對音色特征和用途做了詳細的分類,包括通用、播音、短視頻爆款、廣告、科普、小說等不同類型,查找起來非常方便。
TTSMarker 生成的音頻支持免費商用,每周可以免費轉(zhuǎn)換 30000 個字符,單次最高支持轉(zhuǎn)換 10000 字符;轉(zhuǎn)換時可以調(diào)節(jié)語速、音高和段落間的停頓時間,可以滿足大部分的配音需求了。
網(wǎng)站直達: https://www.text-to-speech.cn/
「TTS-文本轉(zhuǎn)語音」也是一個免費的網(wǎng)站,有 20 多種人物音色,支持中文、英語等不同國家的語言和 10 多種中文方言,單次可以轉(zhuǎn)換 10000 字的文本內(nèi)容。它支持多音字、停頓、調(diào)整語速音調(diào)等功能,部分音色支持情感控制,比如積極愉快、嚴肅沉穩(wěn)、生氣、猶豫等,還可以模仿不同年齡的人說話的特征,很適合用于故事或者小說配音。
網(wǎng)站直達: https://luvvoice.com/
Luvvoice 是一款免費的在線 TTS 工具,提供超過 200 種音色和 70 種語言的內(nèi)容轉(zhuǎn)換,其中中文語音有 14 種,包含普通話、粵語、臺灣腔、東北話等多個類型。單次最高支持 6000 字的文本轉(zhuǎn)換,可以免費用于商業(yè)用途。
網(wǎng)站直達: https://chattts.com/
ChatTTS 是一款適用于對話場景的文本轉(zhuǎn)語音工具,支持中文和英語,音色非常自然,能實現(xiàn)中英文混雜內(nèi)容的無縫切換配音,還可以加入停頓、笑聲、感嘆等情緒特征。
ChatTTS 本身是一個開源模型,如果你懂一些編程技術(shù),可以在 Github 上將其部署到本地使用(也可以到網(wǎng)上找一下有沒有一鍵安裝包),僅需 4G 的顯存就能運行。不過模型許可為 CC BY-NC 4.0,僅用于教育和研究用途,不應用于任何商業(yè)或非法目的,大家在使用的時候需要注意。
網(wǎng)站直達: https://freetts.com/zh-tw
FreeTTS 是一個綜合性的音頻處理網(wǎng)站,功能包括文本轉(zhuǎn)語音、語音轉(zhuǎn)文本、音頻提取、音頻剪輯等。它的 TTS 功能支持中文、英文等不同國家的語言,其中中文支持普通話、粵語、四川方言、臺灣方言、廣西方言等不同類型。每周可免費轉(zhuǎn)換 2000 字,支持免費商用
模型網(wǎng)站: https://github.com/FunAudioLLM/CosyVoice (網(wǎng)盤有 windows 一鍵安裝包)
CosyVoice 是我最近發(fā)現(xiàn)的一款 AI 配音神器,它不僅支持文本轉(zhuǎn)語音,還支持快速音色克隆,也就是我們可以克隆自己的聲音進行音色配置。它支持中文(含粵語)、英語、日語、韓語 4 種語言,配音效果非常自然穩(wěn)定、還支持超長文本、情感控制、停頓等功能,適合對配音有強需求的小伙伴(電腦顯存需要 4G 以上)。
CosyVoice 本身也是一款免費開源工具,可以部署到本地免費使用,下面簡單介紹一下 windows 一鍵安裝包的基礎用法:
① 下載并解壓安裝包,記得安裝路徑中文、特殊字符和空格,否則可能會啟動失敗;
② 雙擊運行 “GPU 診斷” 和 “查看 CUDA 版本” 文件,確保已經(jīng)安裝 CUDA,并且 GPU 可用。然后雙擊 “運行-CosyVoice-300M” 文件啟動程序,等待 WebUI 界面開啟(第一次會出現(xiàn)無法打開的提醒,無需理會,等待代碼加載完成刷新后 WebUI 會自動打開)。
③ 在 WebUI 界面可以看到 4 種推理模式,每種模式代表不同的功能:
- 預訓練音色:使用程序內(nèi)置 7 種音色,將文本轉(zhuǎn)換為語音。
- 3s 極速復刻:通過音頻克隆音色,用新音色將同語種文本轉(zhuǎn)為語音。
- 跨語種復刻:通過音頻克隆音色,然后用新音色將不同語種的文字轉(zhuǎn)換為語音。
- 自然語言控制:通過在文本中插入情緒標簽,為配音添加笑聲、停頓等元素。
如果想用內(nèi)置的預設音色生成音頻,就選 “預訓練音色” 模式。先在「輸入合成文本」中輸入待轉(zhuǎn)換的文本,然后在「選擇預訓練音色」處選擇一個音色,最后點擊底部的「生成音頻」,等待音頻生成即可。生成的音頻會自動保存在根目錄的“音頻輸出”文件夾內(nèi)
如果想克隆自己的聲音在進行配音,選 “3s 極速復刻” 模式,然后按一下步驟操作:
- 先在「輸入合成文本」中輸入待轉(zhuǎn)換的文本,
- 然后在「參考音頻」處上傳自己的聲音文件(或用麥克風錄制一份)。聲音文件不要超過 30s,人聲清晰不能有雜音,錄制要連貫,不要有中斷。
- 在「輸入 prompt 文本」處輸入上傳音頻的文字內(nèi)容,比如我錄的音頻內(nèi)容是“我是花生,很高興和大家見面”,就把這幾個字原封不動的填寫進去。
- 點擊底部的「生成音頻」,等待音頻生成,這里的音頻就是用你自己的聲音了。
- 完成后可以在「輸入新的音色名稱」處為我們的音色命名,比如我的是“XHS”,然后點擊 「保存剛剛推理的 zero-shot 音色」,我們的聲音就會被保存為一個文件。之后在“預訓練音色”模式下,可以在「選擇新增音色」處隨時選擇使用我們自己的音色了。
以上就是本期為大家推薦的 6 款免費好用的 TTS 文本轉(zhuǎn)語音工具,喜歡的話記得點贊、收藏、評論三連支持一波,我會更有動力為大家分享新的干貨內(nèi)容~
想了解更多設計神器的話,歡迎關(guān)注優(yōu)設網(wǎng)神器推薦專欄 和優(yōu)設微信視頻號,超多好用的設計神器等你探索。也歡迎大家掃描下方的二維碼加入“優(yōu)設 AI 知識交流群”,和我及其他設計師一起交流學習 AI 知識~
另外我的最新課程《AI 視頻零基礎系統(tǒng)入門》已經(jīng)上線了,對 AI 視頻感興趣的小伙伴不要錯過。課程內(nèi)容包括:
- 從文生視頻、圖生視頻、視頻生成視頻、數(shù)字人視頻 4 個方面,系統(tǒng)全面地帶你了解目前主流的 AI 視頻制作方式以及優(yōu)缺點;
- 十余種熱門 AI 視頻生成神器用法詳解,輕松掌握大神同款工具;
- 附贈課程專屬工具清單,收錄了近 300 款 AI 視頻、音頻、文案神器,全面賦能 AI 視頻創(chuàng)作
- 高質(zhì)量免費自學資源、最新 AI 視頻資訊獲取渠道全分享
推薦閱讀:
復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機派送獎品
2012年成立至今,是國內(nèi)備受歡迎的設計師平臺,提供獎品贊助 聯(lián)系我們
品牌形象設計標準教程
已累計誕生 726 位幸運星
發(fā)表評論 為下方 10 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓