大家好,我是 Clippp。今天為大家分享的是「虛擬數(shù)字人」。這段時(shí)間元宇宙概念的大火帶動(dòng)了很多人對未來的無限遐想,與元宇宙緊密相關(guān)的虛擬數(shù)字人的熱度也在提升。
現(xiàn)在網(wǎng)絡(luò)上經(jīng)常出現(xiàn)各式各樣的數(shù)字人,虛擬偶像、虛擬主播層出不窮,當(dāng)然伴隨著數(shù)字人一同出現(xiàn)的還有各種爭議…
今天我們就來一起探究虛擬數(shù)字人是什么、具有哪些特征,分為哪幾種類型以及都應(yīng)用在什么行業(yè),深入地了解虛擬數(shù)字人概念。
虛擬數(shù)字人是指具有數(shù)字化外形的虛擬人物。與具備實(shí)體的機(jī)器人不同,虛擬數(shù)字人依賴顯示設(shè)備存在,我們所知的很多虛擬人都要通過手機(jī)、電腦或者智慧大屏等設(shè)備才能顯示。
虛擬數(shù)字人應(yīng)具備以下三方面特征:
- 一是擁有人的外觀,具有特定的相貌、性別和性格等人物特征;
- 二是擁有人的行為,具有用語言、面部表情和肢體動(dòng)作表達(dá)的能力;
- 三是擁有人的思想,具有識別外界環(huán)境、并能與人交流互動(dòng)的能力。
綜合來看,就是具備四方面的能力,即形象能力、感知能力、表達(dá)能力和娛樂互動(dòng)能力。
如果我們下次再看到有公司推出數(shù)字人,就可以結(jié)合這些特征和能力來判斷這個(gè)數(shù)字人的可信度,避免被借勢營銷的企業(yè)鉆了空子。
知道了什么是數(shù)字人,接下來就要搞清楚數(shù)字人到底是怎么說話、互動(dòng)的,是背后有真人在操控,還是完全通過技術(shù)生成。
面對新興的數(shù)字人,相信很多讀者都存在類似的疑問。數(shù)字人的誕生發(fā)展和 AI 人工智能可以說是密不可分,想了解數(shù)字人的運(yùn)作原理,首先要知道數(shù)字人的通用系統(tǒng)框架。
虛擬數(shù)字人系統(tǒng)一般情況下由人物形象、語音生成、動(dòng)畫生成、音視頻合成顯示、交互等 5 個(gè)模塊構(gòu)成。(資料參考: 2020 年虛擬數(shù)字人發(fā)展白皮書)
交互模塊為擴(kuò)展項(xiàng),根據(jù)其有無,可將數(shù)字人分為交互型數(shù)字人和非交互型數(shù)字人。
首先看一下非交互型數(shù)字人:系統(tǒng)依據(jù)目標(biāo)文本生成對應(yīng)的人物語音及動(dòng)畫,并合成音視頻呈現(xiàn)給用戶。
交互型數(shù)字人根據(jù)驅(qū)動(dòng)方式的不同可分為智能驅(qū)動(dòng)型和真人驅(qū)動(dòng)型。
智能驅(qū)動(dòng)型數(shù)字人:通過智能系統(tǒng)自動(dòng)讀取并解析識別外界輸入信息,根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,驅(qū)動(dòng)人物模型生成相應(yīng)的語音與動(dòng)作來使數(shù)字人跟用戶互動(dòng)。
這種人物模型是預(yù)先通過 AI 技術(shù)訓(xùn)練得到,可通過文本驅(qū)動(dòng)生成語音和對應(yīng)動(dòng)畫,業(yè)內(nèi)將此模型稱為 TTSA(Text To Speech & Animation)人物模型。
真人驅(qū)動(dòng)型數(shù)字人:真人根據(jù)視頻監(jiān)控系統(tǒng)傳來的用戶視頻,與用戶實(shí)時(shí)語音,同時(shí)通過動(dòng)作捕捉采集系統(tǒng)將真人的表情、動(dòng)作呈現(xiàn)在虛擬數(shù)字人形象上,從而與用戶進(jìn)行交互。
調(diào)研分析當(dāng)前市場上的數(shù)字人,根據(jù)人物圖形維度,分為 2D 和 3D 兩大類,從外形上可分為卡通、寫實(shí)等風(fēng)格,綜合來看可分為二次元、3D 卡通、3D 高寫實(shí)、真人形象四種類型。
接下來根據(jù)每種類型的特點(diǎn),從外在形象、服飾裝扮、表情動(dòng)作等方面,結(jié)合典型案例來逐一分析虛擬數(shù)字人的設(shè)計(jì)。
1. 二次元類型
虛擬歌手-洛天依
洛天依的職業(yè)設(shè)定為虛擬歌姬,個(gè)性軟萌可愛、溫柔細(xì)膩,外貌特征上是灰發(fā)、綠瞳,頭戴碧玉發(fā)飾。
除了獨(dú)特的形象和性格,洛天依還能唱歌、跳舞、直播帶貨,多樣的才藝加持讓人物設(shè)定不單薄,受到很多用戶的關(guān)注。
2. 3D 卡通類型
虛擬助理-度曉曉
度曉曉是基于虛擬人 IP 的陪伴型虛擬助理。在小度助手的能力基礎(chǔ)上,度曉曉有虛擬人物形象和情感交互系統(tǒng),具備視覺識別能力,支持自然的交流方式。
在外形裝扮上,度曉曉是紅色短發(fā)的甜美可愛風(fēng),五官比例偏向二次元風(fēng)格。根據(jù)現(xiàn)有案例來看,度曉曉在眨眼、微笑等面部微動(dòng)作以及肢體的造型,都很自然、生動(dòng),整體設(shè)計(jì)效果相對較好。
度曉曉定期更新身穿不同主題服裝、擺著各種 pose 的形象,每套服裝都有一個(gè)主題再帶配上各種周邊小配飾,營造出一種清新時(shí)尚的效果。
3. 3D 高寫實(shí)類型
浦發(fā)銀行數(shù)字員工-小浦
小浦作為銀行的數(shù)字員工,主要進(jìn)行風(fēng)險(xiǎn)評估、要聞播報(bào)、投資建議等在線服務(wù)。
從外觀上,小浦在形象上無論發(fā)型還是五官都足夠擬人化、職業(yè)化,穿著銀行職業(yè)裝,屬于比較典型的銀行職員形象。
小浦沒有很夸張的面部表情,始終以面帶微笑的狀態(tài)面向用戶,給人一種親切感。肢體動(dòng)作相對較少,沒有特別夸張的動(dòng)作設(shè)定,只有固定的幾套動(dòng)作。
虛擬偶像-AYAYI
AYAYI 是使用 Unreal 引擎造出來的特別擬真的 Metahuman 形象。
外在形象:寫實(shí)程度更高,人物整體效果已經(jīng)和真人十分接近,五官特別精致、眼瞼微斂、銀色短發(fā),散發(fā)著一種清冷氣質(zhì)。
從 AYAYI 社交賬號的更新來看,目前主要是分享一些 AYAYI 的擺拍圖片,穿著的服裝、飾品都比較真實(shí)、時(shí)尚,拍照環(huán)境都是休閑、藝術(shù)類的場景。
AYAYI 人物形象的時(shí)尚感和真實(shí)感,更容易切入商業(yè)化,比如穿著特定品牌的服裝進(jìn)行擺拍。
高保真數(shù)字人-Siren(塞壬)
Siren 是高保真、實(shí)時(shí)、可交互數(shù)字人,用到了實(shí)時(shí)渲染、表情捕捉、動(dòng)作捕捉、高保真 3D 掃描等前沿技術(shù),達(dá)到了目前業(yè)界最高的技術(shù)水平。
Siren 的面貌細(xì)節(jié)更加真實(shí),可以很清楚看到皮膚的細(xì)節(jié)、眼睛的轉(zhuǎn)動(dòng)、說話的神態(tài)、臉上各種各樣的細(xì)紋。不管是毛孔、細(xì)紋等皮膚質(zhì)感,還是神態(tài)上的表情,都很像真人。
Siren 在說話時(shí)嘴唇動(dòng)作自然,效果真實(shí)。
之所以有的數(shù)字人看起來不自然,很大一部分原因是因?yàn)閿?shù)字人面部表情不生動(dòng),特別是在說話時(shí)嘴唇和臉部、牙齒甚至舌頭的聯(lián)動(dòng),很容易出現(xiàn)動(dòng)作不聯(lián)動(dòng)、不真實(shí)的情況。
4. 真人形象類型
新華社 AI 合成主播-新小浩
“新小浩”是無論外在形象、面部表情、服裝搭配、說話聲音,還是肢體動(dòng)作上,都是完全基于真實(shí)主持人生成。
通過語音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報(bào)能力的“AI 合成主播”。
我們每天都會(huì)遇見各種各樣的人,即使臉上最細(xì)微的表情,我們都可以感知到,用計(jì)算機(jī)打造出來的表情,往往缺乏靈氣。真人形象的虛擬主播的優(yōu)勢在于,他的特征都是來源于真人,呈現(xiàn)的面貌和狀態(tài)更容易被用戶了解。如果不仔細(xì)看,可能分辨不出是不是真人。
目前國內(nèi)市場上已經(jīng)出現(xiàn)了非常多的虛擬數(shù)字人,在各行各業(yè)中有著廣泛的應(yīng)用。
虛擬數(shù)字人技術(shù)結(jié)合實(shí)際應(yīng)用場景領(lǐng)域,切入各類行業(yè),形成行業(yè)應(yīng)用解決方案,賦能影視、傳媒、游戲、金融、文旅等領(lǐng)域,根據(jù)需求為用戶提供定制化服務(wù)。
按照應(yīng)用場景或行業(yè)的不同,已經(jīng)出現(xiàn)了娛樂型數(shù)字人,如虛擬偶像、歌手、網(wǎng)紅、虛擬代言人等;
助手型數(shù)字人,如虛擬客服、虛擬導(dǎo)游、智能助手。
主播型數(shù)字人,如虛擬主播、虛擬主持人等。
這里搜集的案例只是虛擬數(shù)字人的應(yīng)用的一小部分,還有很多優(yōu)秀的應(yīng)用案例等待著大家去一起發(fā)現(xiàn)。
國內(nèi)有很多互聯(lián)網(wǎng)平臺在研發(fā)虛擬數(shù)字人,我也從中收獲了大量的信息和資料,這次把這些平臺分享給大家:
- 搜狗AI開放平臺:https://ai.sogou.com/
- 網(wǎng)易伏羲:https://fuxi.163.com/
- 網(wǎng)易易現(xiàn):https://www.ezxr.com/
- 百度AI開放平臺:https://ai.baidu.com/
- 騰訊云:https://cloud.tencent.com/
- NEXTStudios:https://www.nextstudios.com/
- 訊飛開放平臺:https://www.xfyun.cn/
- 商湯科技:https://www.sensetime.com/cn
- 魔琺:https://www.xmov.ai/
- 曠視:https://www.megvii.com/
歡迎關(guān)注作者微信公眾號:「Clip設(shè)計(jì)夾」
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計(jì)師平臺,提供獎(jiǎng)品贊助 聯(lián)系我們
品牌形象設(shè)計(jì)標(biāo)準(zhǔn)教程
已累計(jì)誕生 726 位幸運(yùn)星
發(fā)表評論 為下方 3 條評論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓