亚洲av无码av制服丝袜在线,新版福利视频在线观看,婷婷四虎东京热无码群交双飞视频,我把护士日出水了视频90分钟,无码人妻精品一区二区三区99不卡

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

2025/05/19 推薦：數(shù)字生命卡茲克評(píng)論有獎(jiǎng) 閱讀本文需 10 分鐘

收藏 15

點(diǎn)贊 45

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

幾個(gè)月前，我寫(xiě)過(guò)一篇 MiniMax 的 AI 聲音模型。

30秒完美復(fù)刻你的聲音，這就是當(dāng)今最強(qiáng)的中文AI語(yǔ)音克?。?/h2>
往期作者干貨：中文，在 AI 世界，好像突然一夜崛起了。
閱讀文章 >

我說(shuō)，那就是當(dāng)時(shí)最強(qiáng)的中文 AI 音頻。數(shù)據(jù)也有點(diǎn)小爆。

而在去年 12 月之后，至今將近半年時(shí)間，在 AI 聲音模型這塊，我覺(jué)得還是沒(méi)有能超越 MiniMax 的。

直到昨天，我看到 MiniMax 在 X 上發(fā)了他們新一代聲音模型的技術(shù)報(bào)告，Speech-02 來(lái)了?？磥?lái)想突破 Speech-01 的上限，還是得他們自己。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

不過(guò)就是這數(shù)據(jù)是真的慘淡，看來(lái)大家最近關(guān)注的都是 Agent、MCP，AI 音頻關(guān)注的人，是真的少。。。

我大概翻了一下，跑分確實(shí)牛逼不少，主要是 WER 和 SIM 這兩數(shù)據(jù)。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

兩個(gè)維度，左邊是 WER，越低越好，代表這個(gè)模型講出來(lái)的話，有多準(zhǔn)確。右邊是 SIM，越高越好，代表這個(gè)模型講出來(lái)的聲音，有多像原聲。

你可以簡(jiǎn)單的理解成，左邊看的是 AI 說(shuō)的對(duì)不對(duì)，右邊看的是 AI 像不像本人。

WER 的數(shù)據(jù)，除了一些歐美的小語(yǔ)種，主流語(yǔ)種幾乎都?jí)毫四壳笆澜绻J(rèn)最被推崇的 11Labs 一頭，特別是周邊的亞洲國(guó)家，日本、越南、泰國(guó)，幾乎都是純碾壓姿態(tài)，所有語(yǔ)種的 WER 指標(biāo)幾乎平均都在 1~4 之間，很牛逼，他們這是正兒八經(jīng)在多語(yǔ)種上發(fā)力了

而音色相似度上，上一代其實(shí)做的沒(méi)有 11labs 好，海外的很多反饋都是聲音沒(méi)有 11Labs 像，但是這一次，實(shí)現(xiàn)了全面超越，32 個(gè)語(yǔ)種，每一個(gè)在跑分上都比 11Labs 要強(qiáng)，我自己實(shí)測(cè)，也能明顯感覺(jué)到，相似度已經(jīng)比 11labs 好了。

我又去看了一下 AI 音頻領(lǐng)域的盲測(cè)競(jìng)技場(chǎng)。

意外的發(fā)現(xiàn)。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

MiniMax 這個(gè)新模型。

登頂了。。。

現(xiàn)在，這個(gè)新模型，MiniMax Speech-02，已經(jīng)可以在 MiniMax 官網(wǎng)用了，目前只有海外版有聲音克隆，別問(wèn)我為什么只有海外版有。

網(wǎng)址在此： https://www.hailuo.ai/audio

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

我隨手用 MiniMax+即夢(mèng)大師版，搓了一個(gè)有趣的郭小綱動(dòng)畫(huà)，給大家直觀的感受一下，MiniMax 的 Speech-02 有多強(qiáng)。

當(dāng)視頻在手機(jī)上無(wú)法加載，可前往PC查看。

我就扔了一段不到 1 分鐘的原聲進(jìn)去復(fù)刻，說(shuō)實(shí)話，這音調(diào)，這起伏，這音色，強(qiáng)的有點(diǎn)不像話了。

我第一次聽(tīng)到的時(shí)候，真的感覺(jué)真假難分。

不僅郭小綱，還能讓，周小倫，來(lái)夸一夸我。

太像了。

你閉著眼睛，你是真的能感覺(jué)到，是周董，在你面前揮舞著手臂，用那獨(dú)特的強(qiáng)調(diào)跟你說(shuō)，你還挺屌的。

還有之前艾爾登法環(huán)，預(yù)告片里面菈妮的配音我一直很喜歡。

我也讓 MiniMax 復(fù)刻了一下。

這是上一代 Speech-01-hd 的效果。

而這是，Speech-02-hd 的效果。

我相信，一定能非常輕松的感受到，情緒的差距。

說(shuō)說(shuō)咋用。

進(jìn)入 Minimax 的 Audio 官網(wǎng)后，點(diǎn)擊左邊的 Voices。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

免費(fèi)用戶，可以免費(fèi)克隆 3 個(gè)聲音。

我是開(kāi)了 5 刀的會(huì)員，所以可以創(chuàng)建 10 個(gè)。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

點(diǎn)進(jìn)去以后，直接上傳你的素材，然后正常命名，選素材的主語(yǔ)言就行，超級(jí)簡(jiǎn)單。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

上傳的語(yǔ)音最少上傳 10s 的音頻片段就可以克隆了，不過(guò)這個(gè)樣本其實(shí)不是特別夠，所以我一般推薦音頻素材最好在 30s 左右，當(dāng)然你也可以更長(zhǎng)，不過(guò)一般不需要超過(guò) 5 分鐘。

然后只需要十幾秒，一個(gè)新鮮的聲音模型，就克隆好了。

后續(xù)使用的時(shí)候，直接在右邊的聲音選擇界面里面找到自己的 tab，正常使用就行。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

一代的時(shí)候，這個(gè)聲音模型，只支持 12 種語(yǔ)言，分別是：

中文、粵語(yǔ)、英語(yǔ)、韓語(yǔ)、日語(yǔ)、印尼語(yǔ)、西語(yǔ)、葡語(yǔ)、法語(yǔ)、意大利語(yǔ)、俄語(yǔ)、德語(yǔ)。

但是這一次的 2 代，支持了 32 種語(yǔ)言。

而且在混合語(yǔ)種上，有更好的效果了。

比如我之前看到一個(gè)非常有意思的挑戰(zhàn)。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

文字是這樣的：

“皆さん，我在網(wǎng)絡(luò)上面看到有 someone 把三個(gè)國(guó)家的 language 混在一起去 speak。我看到之后 be like これは我じゃないか，私も try one try です”。

非常離譜。

我克隆了我自己的聲音，然后去試著念了一下。

這是上一代 Speech-01-hd：

我保證，你聽(tīng)完以后也不知道它到底念了個(gè)啥，我就聽(tīng)到一個(gè) Speak。。。

再來(lái)聽(tīng)聽(tīng) 2 代的。

雖然日文那還有一點(diǎn)奇怪，但是，已經(jīng)是能完整的區(qū)分出來(lái)念的明明白白的了好吧，這已經(jīng)是，史詩(shī)級(jí)進(jìn)步了。

我又搞了一個(gè)更復(fù)雜的，小皇四郎。

文本是這樣的：

“媽的，最煩裝逼的人了。剛回國(guó)，問(wèn)他論文咋樣，他說(shuō)：

“我要 restructure 一下 framework?！?/p>

我翻了個(gè)白眼，結(jié)果他又來(lái)一句：

“Ah non, pas de sucre, merci~”

然后切日語(yǔ)：「これはマジでイラっとするわ?」

再來(lái)西語(yǔ)：“?Qué pesado! Pero suena perfecto.”

最后還補(bǔ)一句英語(yǔ)：“Seriously. Stop pretending you’re special.”

我都想說(shuō)：你到底是人，還是 AI？

哦，他是 MiniMax Speech two，新模型?！?/p>

當(dāng)視頻在手機(jī)上無(wú)法加載，可前往PC查看。

真的，實(shí)在太好玩了。

雖然最后的中文，念的還是冒出了翻譯腔，但是進(jìn)步已經(jīng)巨大了。

而且，還有一個(gè)超級(jí)屌的點(diǎn)是，他們?cè)谥v故事的場(chǎng)景中，如果你只用一個(gè)聲音的話，在一些不同角色那里，它甚至?xí)胁煌囊粽{(diào)變化和情緒變化。

這是我的一份故事文稿。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

我直接讓 Speech-02-hd 一鍵直出，然后我自己稍微剪了下，加了點(diǎn)音效，大家可以聽(tīng)一聽(tīng)這個(gè)情緒，還有角色的變化。

文稿中標(biāo)黃的那幾句，大家應(yīng)該能明顯的聽(tīng)出來(lái)，是刻意壓低了音調(diào)，改了情緒。這可不是我處理的，是 MiniMax 直出的，這就非常牛逼了。

除了 C 端產(chǎn)品之外，我看了一眼 API，發(fā)現(xiàn)，他們已經(jīng)第一時(shí)間把 Speech-02 給支持了。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

甚至，MCP 也弄好了。

中國(guó)團(tuán)隊(duì)打造！這才是現(xiàn)在最強(qiáng)的AI聲音模型！

現(xiàn)在，你可以在任何 Agent 產(chǎn)品里，也可以接入這個(gè)逼真到爆炸的語(yǔ)音模型了。

我們也可以自豪的說(shuō)一聲。

之前，中文 AI 語(yǔ)音，我們做到了世界最強(qiáng)，但是現(xiàn)在，可以把中文去掉了，整體上，我們都已經(jīng)做到了世界最強(qiáng)。

這是一個(gè)被所有人低估的戰(zhàn)場(chǎng)。

大家都在盯著誰(shuí)做出第一個(gè)像人一樣思考的 Agent，卻沒(méi)看到，那些 AI 說(shuō)話的聲音，其實(shí)早已變得越來(lái)越跟真人無(wú)異。

而且，這一次，還是我們做出來(lái)的。

在 12 月份的那邊 MiniMax AI 音頻的文章中，我在最后寫(xiě)道：

“也許，這就是屬于中文世界的 AI 時(shí)代的序章。而這一切，才剛剛開(kāi)始。”

然后就是波瀾壯闊的春節(jié)。

隨后的故事，大家也都知道了。

一語(yǔ)成讖。

現(xiàn)在的 AI 世界，再也不是英語(yǔ)的獨(dú)角戲了。

我們從配角，走向主角。

然后不僅僅止步于起。

像 MiniMax，也用 AI，給世界，盡可能的帶來(lái)語(yǔ)言平權(quán)。

那些過(guò)去沒(méi)被在意的語(yǔ)言，過(guò)去只能在家族里、在小巷里、在廟宇里才能聽(tīng)到的聲音，現(xiàn)在終于有機(jī)會(huì)，能被世界聽(tīng)見(jiàn)了。

AI 沒(méi)有帶來(lái)統(tǒng)治。

反而是把人類的多樣性。

放進(jìn)了未來(lái)。

數(shù)字生命卡茲克

文章 37 人氣 77.5w

AI自媒體

+關(guān)注作者

收藏 15

點(diǎn)贊 45

復(fù)制本文鏈接文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng)，未經(jīng)允許不得轉(zhuǎn)載。

繼續(xù)閱讀本文相關(guān)話題

AIGC

網(wǎng)頁(yè)

產(chǎn)品

職場(chǎng)

學(xué)AI

AI導(dǎo)航

你即將學(xué)會(huì) AI Agent 的知識(shí)

超多案例！讓 Lovart 作圖更好看更高效的提示詞在這里了！

1.7w 人閱讀

上一篇

你即將學(xué)會(huì) AIGC 的知識(shí)

為什么蘋(píng)果和微信在AI的節(jié)奏上快不起來(lái)？

8.9k 人閱讀

下一篇

發(fā)評(píng)論！每天贏獎(jiǎng)品

點(diǎn)擊登錄后，在評(píng)論區(qū)留言，系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品

2012年成立至今，是國(guó)內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái)，提供獎(jiǎng)品贊助聯(lián)系我們

本期獎(jiǎng)品

品牌形象設(shè)計(jì)標(biāo)準(zhǔn)教程

已累計(jì)誕生 726 位幸運(yùn)星

查看獲獎(jiǎng)名單

發(fā)表評(píng)論為下方 4 條評(píng)論點(diǎn)贊，解鎖好運(yùn)彩蛋

{{ moreBtnTxt }}

以上留言僅代表用戶個(gè)人觀點(diǎn)，不代表優(yōu)設(shè)立場(chǎng)

評(píng)論就這些咯，讓大家也知道你的獨(dú)特見(jiàn)解立即評(píng)論

閱讀相關(guān)文章

數(shù)字生命卡茲克

2024/12/12

閱讀 1.8w

AI創(chuàng)作

30秒完美復(fù)刻你的聲音，這就是當(dāng)今最強(qiáng)的中文AI語(yǔ)音克隆！

這就是當(dāng)今最強(qiáng)的，AI 中文語(yǔ)音克隆，沒(méi)有之一。

9分鐘閱讀

數(shù)字生命卡茲克

2024/09/26

閱讀 2.3w

AI創(chuàng)作

字節(jié)全新發(fā)布豆包AI視頻模型：再見(jiàn)了Sora，你的時(shí)代過(guò)去了

一個(gè)顛覆行業(yè)的全新的起點(diǎn)，正式到來(lái)了。

11分鐘閱讀

數(shù)字生命卡茲克

2024/11/25

閱讀 1.9w

AI創(chuàng)作

體驗(yàn)完Vidu劃時(shí)代的新功能，我覺(jué)得可以正式拋棄3D渲染了

現(xiàn)在很多人意識(shí)不到，但是在 AI 視頻領(lǐng)域，它可能是劃時(shí)代的一個(gè)技術(shù)。

8分鐘閱讀

夏花生

2023/04/13

閱讀 4.0w

AI創(chuàng)作

Plask！通過(guò)3D模型控制人物姿勢(shì)的在線AI繪畫(huà)神器

今天要為大家介紹的是一個(gè)能提取圖像人物骨架姿勢(shì)，生成對(duì)應(yīng)姿勢(shì)圖像的 AI 工具 Plask，一起來(lái)看看吧~

AIGC AI創(chuàng)作

6分鐘閱讀

58UXD

2023/05/18

閱讀 6.3w

AI創(chuàng)作

有這7個(gè)超好用插件，你也能成為頂級(jí)AI繪畫(huà)師！

頂級(jí) AI 繪畫(huà)師=Midjourney 和 Stable diffusion 結(jié)合使用+7 個(gè)輔助工具相輔相成。

AIGC AI繪畫(huà)

14分鐘閱讀

{{comTitle}} {{comSubtitle}}

評(píng)論

收藏

繼續(xù)閱讀

30秒完美復(fù)刻你的聲音，這就是當(dāng)今最強(qiáng)的中文AI語(yǔ)音克隆！

1.8w人氣

字節(jié)全新發(fā)布豆包AI視頻模型：再見(jiàn)了Sora，你的時(shí)代過(guò)去了

2.3w人氣

體驗(yàn)完Vidu劃時(shí)代的新功能，我覺(jué)得可以正式拋棄3D渲染了

1.9w人氣

設(shè)計(jì)師應(yīng)該如何擁抱AIGC？來(lái)看高手的總結(jié)！

2.4w人氣

關(guān)于我們

優(yōu)設(shè)是國(guó)內(nèi)專業(yè)設(shè)計(jì)師平臺(tái)，2012年創(chuàng)辦至今，作為行業(yè)風(fēng)向標(biāo)，我們13年來(lái)專注于設(shè)計(jì)師創(chuàng)作者的學(xué)習(xí)成長(zhǎng)交流。通過(guò)優(yōu)設(shè)網(wǎng)、優(yōu)優(yōu)教程網(wǎng)、優(yōu)創(chuàng)網(wǎng)分別沉淀優(yōu)質(zhì)內(nèi)容。是一家集齊媒體、內(nèi)容、服務(wù)的多元化平臺(tái)。MCN矩陣@優(yōu)設(shè)AIGC 在微博、微信、小紅書(shū)、抖音、B站布局，全網(wǎng)粉絲過(guò)千萬(wàn)。

熱門頻道

AIGC專題
熱門問(wèn)答
設(shè)計(jì)大賽
免費(fèi)教程
設(shè)計(jì)導(dǎo)航
設(shè)計(jì)課程

設(shè)計(jì)靈感

主編推薦
Banner設(shè)計(jì)
海報(bào)設(shè)計(jì)
Logo設(shè)計(jì)
插畫(huà)繪畫(huà)
字體設(shè)計(jì)

支持與服務(wù)

官方社群
優(yōu)設(shè)官方微信群
01優(yōu)設(shè)AIGC自學(xué)交流群
02優(yōu)設(shè)小紅書(shū)個(gè)人IP交流群
03優(yōu)設(shè)設(shè)計(jì)師交流群
04優(yōu)設(shè)UI設(shè)計(jì)師交流群
05優(yōu)設(shè)交互設(shè)計(jì)師交流群
06優(yōu)設(shè)電商交流群
07優(yōu)設(shè)私單群

08優(yōu)設(shè)硬件種草交流群
09優(yōu)設(shè)同城搭子群
10優(yōu)設(shè)大學(xué)生交流群
11優(yōu)設(shè)插畫(huà)師交流群
12優(yōu)設(shè)平面品牌設(shè)計(jì)師交流群
13優(yōu)設(shè)3D設(shè)計(jì)師交流群
14優(yōu)設(shè)攝影剪輯愛(ài)好者交流群
微信掃碼添加管理員招財(cái)

微信號(hào)：掃碼添加

嚴(yán)格審核打造高質(zhì)量交流群

進(jìn)群會(huì)有面試題謝絕打廣告
優(yōu)設(shè)微博

@
優(yōu)設(shè)AIGC
400W粉絲！每日更新設(shè)計(jì)干貨
@
優(yōu)設(shè)
強(qiáng)烈推薦！優(yōu)設(shè)官方品牌微博
@
優(yōu)優(yōu)教程網(wǎng)
官方微博，海量教程看不完
@
優(yōu)設(shè)基礎(chǔ)訓(xùn)練營(yíng)
零基礎(chǔ)入門，帶你成為軟件高手
優(yōu)設(shè)微信

每天官微五分鐘

一年萌新變大神

掃碼關(guān)注

1000W

優(yōu)設(shè)新媒體矩陣等你來(lái)關(guān)注

優(yōu)設(shè)

優(yōu)優(yōu)教程網(wǎng)

AI自學(xué)平臺(tái)

優(yōu)設(shè)大課堂

設(shè)計(jì)師導(dǎo)航

細(xì)節(jié)獵人

<legend id="ijaea"><abbr id="ijaea"></abbr></legend><s id="ijaea"></s>

<style id="ijaea"></style>