大家好,我是 Clippp。今天為大家分享的是「虛擬數(shù)字人」。這段時(shí)間元宇宙概念的大火帶動(dòng)了很多人對未來的無限遐想,與元宇宙緊密相關(guān)的虛擬數(shù)字人的熱度也在提升。

現(xiàn)在網(wǎng)絡(luò)上經(jīng)常出現(xiàn)各式各樣的數(shù)字人,虛擬偶像、虛擬主播層出不窮,當(dāng)然伴隨著數(shù)字人一同出現(xiàn)的還有各種爭議…

今天我們就來一起探究虛擬數(shù)字人是什么、具有哪些特征,分為哪幾種類型以及都應(yīng)用在什么行業(yè),深入地了解虛擬數(shù)字人概念。

數(shù)字人的三方面特征

虛擬數(shù)字人是指具有數(shù)字化外形的虛擬人物。與具備實(shí)體的機(jī)器人不同,虛擬數(shù)字人依賴顯示設(shè)備存在,我們所知的很多虛擬人都要通過手機(jī)、電腦或者智慧大屏等設(shè)備才能顯示。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

虛擬數(shù)字人應(yīng)具備以下三方面特征:

  • 一是擁有人的外觀,具有特定的相貌、性別和性格等人物特征;
  • 二是擁有人的行為,具有用語言、面部表情和肢體動(dòng)作表達(dá)的能力;
  • 三是擁有人的思想,具有識別外界環(huán)境、并能與人交流互動(dòng)的能力。

綜合來看,就是具備四方面的能力,即形象能力、感知能力、表達(dá)能力和娛樂互動(dòng)能力。

如果我們下次再看到有公司推出數(shù)字人,就可以結(jié)合這些特征和能力來判斷這個(gè)數(shù)字人的可信度,避免被借勢營銷的企業(yè)鉆了空子。

數(shù)字人的運(yùn)作原理

知道了什么是數(shù)字人,接下來就要搞清楚數(shù)字人到底是怎么說話、互動(dòng)的,是背后有真人在操控,還是完全通過技術(shù)生成。

面對新興的數(shù)字人,相信很多讀者都存在類似的疑問。數(shù)字人的誕生發(fā)展和 AI 人工智能可以說是密不可分,想了解數(shù)字人的運(yùn)作原理,首先要知道數(shù)字人的通用系統(tǒng)框架。

虛擬數(shù)字人系統(tǒng)一般情況下由人物形象、語音生成、動(dòng)畫生成、音視頻合成顯示、交互等 5 個(gè)模塊構(gòu)成。(資料參考: 2020 年虛擬數(shù)字人發(fā)展白皮書)

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

交互模塊為擴(kuò)展項(xiàng),根據(jù)其有無,可將數(shù)字人分為交互型數(shù)字人和非交互型數(shù)字人。

首先看一下非交互型數(shù)字人:系統(tǒng)依據(jù)目標(biāo)文本生成對應(yīng)的人物語音及動(dòng)畫,并合成音視頻呈現(xiàn)給用戶。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

交互型數(shù)字人根據(jù)驅(qū)動(dòng)方式的不同可分為智能驅(qū)動(dòng)型和真人驅(qū)動(dòng)型。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

智能驅(qū)動(dòng)型數(shù)字人:通過智能系統(tǒng)自動(dòng)讀取并解析識別外界輸入信息,根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,驅(qū)動(dòng)人物模型生成相應(yīng)的語音與動(dòng)作來使數(shù)字人跟用戶互動(dòng)。

這種人物模型是預(yù)先通過 AI 技術(shù)訓(xùn)練得到,可通過文本驅(qū)動(dòng)生成語音和對應(yīng)動(dòng)畫,業(yè)內(nèi)將此模型稱為 TTSA(Text To Speech & Animation)人物模型。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

真人驅(qū)動(dòng)型數(shù)字人:真人根據(jù)視頻監(jiān)控系統(tǒng)傳來的用戶視頻,與用戶實(shí)時(shí)語音,同時(shí)通過動(dòng)作捕捉采集系統(tǒng)將真人的表情、動(dòng)作呈現(xiàn)在虛擬數(shù)字人形象上,從而與用戶進(jìn)行交互。

數(shù)字人常見的類型

調(diào)研分析當(dāng)前市場上的數(shù)字人,根據(jù)人物圖形維度,分為 2D 和 3D 兩大類,從外形上可分為卡通、寫實(shí)等風(fēng)格,綜合來看可分為二次元、3D 卡通、3D 高寫實(shí)、真人形象四種類型。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

接下來根據(jù)每種類型的特點(diǎn),從外在形象、服飾裝扮、表情動(dòng)作等方面,結(jié)合典型案例來逐一分析虛擬數(shù)字人的設(shè)計(jì)。

1. 二次元類型

虛擬歌手-洛天依

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

洛天依的職業(yè)設(shè)定為虛擬歌姬,個(gè)性軟萌可愛、溫柔細(xì)膩,外貌特征上是灰發(fā)、綠瞳,頭戴碧玉發(fā)飾。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

除了獨(dú)特的形象和性格,洛天依還能唱歌、跳舞、直播帶貨,多樣的才藝加持讓人物設(shè)定不單薄,受到很多用戶的關(guān)注。

2. 3D 卡通類型

虛擬助理-度曉曉

度曉曉是基于虛擬人 IP 的陪伴型虛擬助理。在小度助手的能力基礎(chǔ)上,度曉曉有虛擬人物形象和情感交互系統(tǒng),具備視覺識別能力,支持自然的交流方式。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

在外形裝扮上,度曉曉是紅色短發(fā)的甜美可愛風(fēng),五官比例偏向二次元風(fēng)格。根據(jù)現(xiàn)有案例來看,度曉曉在眨眼、微笑等面部微動(dòng)作以及肢體的造型,都很自然、生動(dòng),整體設(shè)計(jì)效果相對較好。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

度曉曉定期更新身穿不同主題服裝、擺著各種 pose 的形象,每套服裝都有一個(gè)主題再帶配上各種周邊小配飾,營造出一種清新時(shí)尚的效果。

3. 3D 高寫實(shí)類型

浦發(fā)銀行數(shù)字員工-小浦

小浦作為銀行的數(shù)字員工,主要進(jìn)行風(fēng)險(xiǎn)評估、要聞播報(bào)、投資建議等在線服務(wù)。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

從外觀上,小浦在形象上無論發(fā)型還是五官都足夠擬人化、職業(yè)化,穿著銀行職業(yè)裝,屬于比較典型的銀行職員形象。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

小浦沒有很夸張的面部表情,始終以面帶微笑的狀態(tài)面向用戶,給人一種親切感。肢體動(dòng)作相對較少,沒有特別夸張的動(dòng)作設(shè)定,只有固定的幾套動(dòng)作。

虛擬偶像-AYAYI

AYAYI 是使用 Unreal 引擎造出來的特別擬真的 Metahuman 形象。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

外在形象:寫實(shí)程度更高,人物整體效果已經(jīng)和真人十分接近,五官特別精致、眼瞼微斂、銀色短發(fā),散發(fā)著一種清冷氣質(zhì)。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

從 AYAYI 社交賬號的更新來看,目前主要是分享一些 AYAYI 的擺拍圖片,穿著的服裝、飾品都比較真實(shí)、時(shí)尚,拍照環(huán)境都是休閑、藝術(shù)類的場景。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

AYAYI 人物形象的時(shí)尚感和真實(shí)感,更容易切入商業(yè)化,比如穿著特定品牌的服裝進(jìn)行擺拍。

高保真數(shù)字人-Siren(塞壬)

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

Siren 是高保真、實(shí)時(shí)、可交互數(shù)字人,用到了實(shí)時(shí)渲染、表情捕捉、動(dòng)作捕捉、高保真 3D 掃描等前沿技術(shù),達(dá)到了目前業(yè)界最高的技術(shù)水平。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

Siren 的面貌細(xì)節(jié)更加真實(shí),可以很清楚看到皮膚的細(xì)節(jié)、眼睛的轉(zhuǎn)動(dòng)、說話的神態(tài)、臉上各種各樣的細(xì)紋。不管是毛孔、細(xì)紋等皮膚質(zhì)感,還是神態(tài)上的表情,都很像真人。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

Siren 在說話時(shí)嘴唇動(dòng)作自然,效果真實(shí)。

之所以有的數(shù)字人看起來不自然,很大一部分原因是因?yàn)閿?shù)字人面部表情不生動(dòng),特別是在說話時(shí)嘴唇和臉部、牙齒甚至舌頭的聯(lián)動(dòng),很容易出現(xiàn)動(dòng)作不聯(lián)動(dòng)、不真實(shí)的情況。

4. 真人形象類型

新華社 AI 合成主播-新小浩

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

“新小浩”是無論外在形象、面部表情、服裝搭配、說話聲音,還是肢體動(dòng)作上,都是完全基于真實(shí)主持人生成。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

通過語音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報(bào)能力的“AI 合成主播”。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

我們每天都會(huì)遇見各種各樣的人,即使臉上最細(xì)微的表情,我們都可以感知到,用計(jì)算機(jī)打造出來的表情,往往缺乏靈氣。真人形象的虛擬主播的優(yōu)勢在于,他的特征都是來源于真人,呈現(xiàn)的面貌和狀態(tài)更容易被用戶了解。如果不仔細(xì)看,可能分辨不出是不是真人。

數(shù)字人的應(yīng)用場景

目前國內(nèi)市場上已經(jīng)出現(xiàn)了非常多的虛擬數(shù)字人,在各行各業(yè)中有著廣泛的應(yīng)用。

虛擬數(shù)字人技術(shù)結(jié)合實(shí)際應(yīng)用場景領(lǐng)域,切入各類行業(yè),形成行業(yè)應(yīng)用解決方案,賦能影視、傳媒、游戲、金融、文旅等領(lǐng)域,根據(jù)需求為用戶提供定制化服務(wù)。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

按照應(yīng)用場景或行業(yè)的不同,已經(jīng)出現(xiàn)了娛樂型數(shù)字人,如虛擬偶像、歌手、網(wǎng)紅、虛擬代言人等;

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

助手型數(shù)字人,如虛擬客服、虛擬導(dǎo)游、智能助手。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

主播型數(shù)字人,如虛擬主播、虛擬主持人等。

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

這里搜集的案例只是虛擬數(shù)字人的應(yīng)用的一小部分,還有很多優(yōu)秀的應(yīng)用案例等待著大家去一起發(fā)現(xiàn)。

代表性的研發(fā)平臺

國內(nèi)有很多互聯(lián)網(wǎng)平臺在研發(fā)虛擬數(shù)字人,我也從中收獲了大量的信息和資料,這次把這些平臺分享給大家:

歡迎關(guān)注作者微信公眾號:「Clip設(shè)計(jì)夾」

從5個(gè)方面,幫你了解什么是虛擬數(shù)字人

收藏 84
點(diǎn)贊 24

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。