人工智能(AI)技術(shù)的進步不僅改變了我們生活的方方面面,還在各行各業(yè)中展現(xiàn)出了巨大的潛力。AI 數(shù)字人,作為人工智能技術(shù)的一個重要分支,正在逐漸成為眾多行業(yè)關(guān)注的焦點。這些虛擬的數(shù)字角色不僅具有逼真的外觀和行為,還能夠以超乎想象的方式與人類交互,從而提供全新的服務體驗和業(yè)務機會。本文整理了 AI 數(shù)字人相關(guān)的基礎概念、趨勢報告、熱點案例、AI 數(shù)字人平臺和開源項目,以及作為設計師我們能用這些 AI 能力產(chǎn)出哪些有意思的工作。
推薦閱讀:
1. 什么是 AI 數(shù)字人?
"數(shù)字人"是指利用先進的計算機圖形學和數(shù)字技術(shù)創(chuàng)造的虛擬人物。這些數(shù)字化的角色可以模擬真實人類的外觀、表情和行為,廣泛應用于娛樂、廣告、虛擬現(xiàn)實和各種互動媒體。數(shù)字人代表了一種技術(shù)進步,使得虛擬角色在視覺和行為上更加逼真,增強了用戶的沉浸感和互動體驗。
"AI 數(shù)字人"則是在數(shù)字人的基礎上融入了人工智能技術(shù)。這不僅使得虛擬角色在外觀上更加逼真,而且能夠模擬人類的交流和行為,如對自然語言的理解、情感的識別和反饋、甚至能學習和自適應,從而能夠進行更復雜的交互和響應。AI 數(shù)字人被應用在智能客服、虛擬助手、在線教育等領(lǐng)域,和其他需要人機交互的場景,提供更加個性化和智能化的服務。
2. AI 數(shù)字人運作原理
AI 數(shù)字人的運作原理基于人工智能算法,包括機器學習、自然語言處理和計算機視覺等技術(shù)。這些技術(shù)使得 AI 數(shù)字人能夠理解和響應人類語言、模擬情感反應,以及在虛擬環(huán)境中以逼真的方式表現(xiàn)出人類般的行為。數(shù)字人系統(tǒng)的模塊構(gòu)成通常包括語音識別和合成模塊、文本到語音轉(zhuǎn)換模塊、圖像和動作捕捉處理模塊,以及一個用于決策和學習的核心 AI 處理單元。這些模塊共同工作,使得數(shù)字人可以在各種場景下提供動態(tài)和自然的交互體驗。
3. AI 數(shù)字人運用場景
客服:AI 數(shù)字人在客服領(lǐng)域被廣泛應用于自動化客戶服務和查詢處理。例如,互聯(lián)網(wǎng)公司或銀行使用的 AI 導購、智能客服等,能夠通過文本或語音交互解答客戶的常見問題,如物流查詢、賬單查詢、服務故障報告,從而提高響應效率并減輕人力客服的負擔。
文娛:在文娛行業(yè),AI 數(shù)字人被用作虛擬角色和主持人,提供互動娛樂體驗。例如,虛擬偶像在音樂會上表演,或者虛擬主播在網(wǎng)絡平臺上進行直播,吸引觀眾參與和互動。
教育:教育領(lǐng)域中,AI 數(shù)字人作為虛擬教師或輔導員,協(xié)助學習和訓練。例如,一些語言學習應用使用 AI 角色來模擬對話練習,或者在醫(yī)學模擬訓練中模擬患者進行診斷練習。
助手:在個人助手領(lǐng)域,AI 數(shù)字人作為智能助理幫助用戶管理日程、發(fā)送提醒、甚至控制智能家居設備。例如,智能手機中的語音助手如蘋果的 Siri,可以幫助用戶設置鬧鐘、查天氣、發(fā)送短信等。
醫(yī)療:在醫(yī)療領(lǐng)域,AI 數(shù)字人被用于模擬醫(yī)療咨詢、患者教育和心理健康支持。例如,虛擬健康助手可以提供初步的健康咨詢和生活方式建議,或者作為虛擬心理治療師提供情緒支持。
金融:在金融行業(yè),AI 數(shù)字人用于提供投資咨詢、市場分析和個性化的財務管理服務。例如,某些銀行和投資平臺利用 AI 助手為客戶提供定制的投資建議和市場趨勢分析,以及協(xié)助進行交易操作等。
4. AI 數(shù)字人的未來十大趨勢
AI 數(shù)字人將在多個行業(yè)中扮演越來越重要的角色,不僅能夠提高效率和減少成本,還能提供更加個性化和高質(zhì)量的服務。隨著技術(shù)的發(fā)展,我們可以預見 AI 數(shù)字人將在未來的各行各業(yè)中發(fā)揮更大的作用,以下是未來 AI 數(shù)字人對各行各業(yè)影響的十大趨勢預測:
- 客戶服務的自動化和個性化:AI 數(shù)字人將在客戶服務領(lǐng)域發(fā)揮越來越大的作用,提供 24/7 的服務,同時能夠根據(jù)客戶的個人喜好和歷史互動提供個性化服務。
- 醫(yī)療保健的革新:在醫(yī)療領(lǐng)域,AI 數(shù)字人可以協(xié)助醫(yī)生進行診斷,提供治療建議,甚至進行遠程手術(shù)協(xié)助,同時也能在患者管理和健康咨詢方面發(fā)揮作用。
- 教育的個性化和可及性提升:AI 數(shù)字人能夠提供個性化教學,適應不同學生的學習速度和風格,使教育更加公平和高效。
- 零售行業(yè)的變革:在零售行業(yè),AI 數(shù)字人可以提供個性化購物體驗,從推薦產(chǎn)品到提供虛擬試穿,改變傳統(tǒng)的購物方式。
- 金融服務的智能化:AI 數(shù)字人將在金融領(lǐng)域提供更智能的資產(chǎn)管理、風險評估和客戶服務,提高金融服務的效率和精確性。
- 娛樂和媒體的定制化:在娛樂和媒體行業(yè),AI 數(shù)字人可以根據(jù)用戶的喜好定制內(nèi)容,提供更加個性化的娛樂體驗。
- 旅游和酒店業(yè)的服務升級:AI 數(shù)字人可在旅游和酒店行業(yè)中提供個性化的旅游建議、預訂服務以及客戶服務,提升客戶體驗。
- 制造業(yè)的效率提升:在制造業(yè)中,AI 數(shù)字人可以協(xié)助設計、生產(chǎn)流程優(yōu)化以及質(zhì)量控制,大幅提高生產(chǎn)效率和減少錯誤率。
- 物流和供應鏈管理的優(yōu)化:AI 數(shù)字人能夠在物流和供應鏈管理中進行高效的資源分配、路線規(guī)劃和庫存管理,提高整體運作效率。
- 法律和咨詢服務的智能化:在法律和咨詢領(lǐng)域,AI 數(shù)字人可以進行案例研究、法律文檔審查以及提供初步咨詢,輔助專業(yè)人員進行更復雜的決策。
一些有價值的研究報告:
- 《好看的皮囊到有趣的靈魂- 數(shù)字人產(chǎn)業(yè)發(fā)展報告》
- 《AI+醫(yī)療:智醫(yī)助理即將上崗- 華西計算機團隊》
- 《2023 年中國 AI 數(shù)字人產(chǎn)業(yè)研究報告》
AI 相關(guān)熱點事件
俄羅斯電視臺:使用 AI 數(shù)字人主播
俄羅斯南部斯塔夫羅波爾地區(qū)的一家電視臺首播了名為“未來預測”的新節(jié)目,其中最引人注意的就是推出了一位女 AI 天氣預報播報員。
北京互聯(lián)網(wǎng)法院:支持保護 AI 生成圖片著作權(quán)
北京互聯(lián)網(wǎng)法院針對人工智能生成圖片(AI 繪畫圖片)著作權(quán)侵權(quán)糾紛作出一審判決,據(jù)悉該案為 AI 生成圖片相關(guān)領(lǐng)域著作權(quán)第一案。
AI 生成圖片著作權(quán)侵權(quán)第一案判決書
達摩院 AI 模型:實現(xiàn)胰腺癌早期篩查
阿里達摩院聯(lián)合國內(nèi)外知名醫(yī)院和科研機構(gòu)等,首次提出以“平掃 CT+AI”進行大規(guī)模的胰腺癌早期篩查。
揭開萬癌之王“隱身衣”!交手 10000000 次+,醫(yī)療 AI 首次實現(xiàn)胰腺癌早篩
斯坦福華人博士 AIGC 視頻: 4 人公司估值 2 億美元
僅有四人的初創(chuàng)公司,已經(jīng)融資 5500 萬美元,融資名單幾乎集齊了硅谷的半壁江山,半年用戶超 50 萬,今天,Pika 1.0 閃亮登場,電影級特效震撼全網(wǎng)。
斯坦福華人博士文生視頻 Pika 1.0 爆火,4 人公司估值 2 億,OpenAI 聯(lián)創(chuàng)參投
接下來整理了國內(nèi)外較知名的三大線上 AI 數(shù)字人平臺,以及使用案例和介紹視頻鏈接。
1. “HeyGen AI”:在線制作數(shù)字人
HeyGen 是一款人工智能驅(qū)動的視頻生成器,可在幾分鐘內(nèi)使用 300 多個人工智能頭像以 40 多種語言創(chuàng)建 100 多種語音的文本轉(zhuǎn)語音視頻。
- 官網(wǎng)鏈接: https://www.heygen.com
- 轉(zhuǎn)換視頻語言案例:火爆的 AI 視頻翻譯工具 HeyGen,背后竟然是一家國內(nèi)的公司
- 使用方法:5 分鐘擁有你的 AI 克隆人!HeyGen AI 數(shù)字人視頻創(chuàng)作平臺介紹
2. “萬興播爆”:AI 輔助營銷
萬興播爆,提供 AI 數(shù)字人定制服務。輸入文案,即可一鍵生成“真人”營銷宣傳視頻。幫助商家生成 AI 數(shù)字人,用于出海營銷等場景。
3. “小冰 AI 數(shù)字人”:前微軟小冰團隊研發(fā)
小冰數(shù)字人脫胎于微軟公司,其核心技術(shù)和團隊源于微軟亞洲互聯(lián)網(wǎng)工程院。
- 官網(wǎng)鏈接: https://business.xiaoice.com
- 介紹視頻:小冰數(shù)字人簡介
現(xiàn)有的 AI 數(shù)字人開源項目能完成上述 AI 數(shù)字人的線上平臺 80%的能力,如果您想訓練屬于自己的 AI 數(shù)字人,通過下列開源實現(xiàn)流程和推薦的開源項目即可實現(xiàn)如下圖所示解決流程。
AI 數(shù)字人開源項目可以分為聲音克隆項目(MockingBird、VITS-fast-fine-tuning)和視頻口型匹配項目(RAD-NeRF、Video-Retalking、DINet、wav2lip 和 SadTalker)兩大類。接下來推薦了多個 AI 數(shù)字人的開源項目并提供了對應項目的官網(wǎng)鏈接和相關(guān)介紹、使用教程視頻鏈接等。
1. 聲音克隆開源項目:
Mocking Bird
推薦指數(shù):☆☆
VITS Fast Fine-tuning
推薦指數(shù):☆☆☆
- 項目鏈接: https://github.com/Plachtaa/VITS-fast-fine-tuning
- 使用教程:VITS-fast-fine-tuning 聲音克隆從頭開始安裝難點解答不求人自己制作整合版手把手安裝
2. 視頻口型匹配開源項目:
RAD-NeRF:
推薦指數(shù):☆☆
項目鏈接: https://github.com/ashawkey/RAD-NeRF
中科大利用該開源項目案例:中科大等研究:和 NeRF 結(jié)合,語音驅(qū)動的高保真說話人臉合成
Video-Retalking:
推薦指數(shù):☆?
項目鏈接: https://github.com/OpenTalker/video-retalking
使用教程:Video Retalking 數(shù)字人開源項目 10 秒視頻驅(qū)動聲音生成逼真視頻
DINet:
推薦指數(shù):☆☆
Wav2Lip:
推薦指數(shù):☆☆☆☆
SadTalker:
推薦指數(shù):☆☆☆
AI 不能簡單的作為“高級的 PS”工具,而是能擴展設計師的能力邊界,借助 AI 完成一整個影視工作室的工作?設計師可以是煉丹師?AI 工程師?剪輯師?模型訓練師?音樂制作人?接下來的幾個工作案例讓我們看看 AI 是如何幫助設計師打破能力邊界的。
此圖由 AI 生成
1. 設計師可以是“煉丹師”?
①AIGC 共享平臺:云端部署“Stable Diffusion”
在 UED 設計團隊中云端部署“Stable Diffusion”,共享使用 AI 生圖工具,幫助團隊降本增效。如在阿里健康設計團隊中部署的 SDWebUI,服務于各個業(yè)務線設計師,已經(jīng)產(chǎn)出 1000+ AI 圖片,應用于各種營銷場景中。
②AI 模型訓練平臺:云端部署“Koya_SS”
利用 AI 模型訓練平臺 Koya_SS,訓練出各業(yè)務專屬的 IP 人物形象。小鹿、小羊、歡猩等多個 LoRA 模型已可以在團隊中共享使用。同時部署在云端,制定標準的訓練流程,讓團隊里每個設計師都能借助訓練平臺完成定制化的 AI 模型訓練,利用 AI 產(chǎn)出更多意想不到的創(chuàng)意工作。
2. 設計師也可以是配音師?
①AI 聲音模擬平臺:“Azure”云端搭建
Azure 云端搭建聲音模擬器,實現(xiàn)多語言旁白生成能力,已實現(xiàn)中文、英文、日文等多國語言,制作對外宣發(fā)、獎項申報等視頻旁白音。每條旁白音可為團隊節(jié)省數(shù)萬至數(shù)十萬元不等,同時 AI 音色不會受環(huán)境的影響而改變,即使對視頻內(nèi)容更改 AI 也能及時適配,大大降降低了視頻制作的成本。
3. 設計師還可以是音樂創(chuàng)作人?
利用 AI 創(chuàng)作音樂,生成 BGM 等背景音,這樣生成出來的音樂是有版權(quán)和可商用的。設計師也可以是音樂制作人。避免視頻音樂侵權(quán),同時為團隊節(jié)省大量的音頻采購版權(quán)費用。
3. 設計師可以是前端工程師?
前端代碼生成模型:“GPTs- IceCoder”
利用 GPT4.0 的 GPTs 模型編譯器,經(jīng)過二次訓練的前端代碼生成 AI 模型“IceCoder”,通過自然語言對話即可生成前端片段。已實現(xiàn)阿里健康設計官網(wǎng)“阿里健康體 2.0”發(fā)布頁的前端搭建和服務器部署。(已發(fā)布在 GPTs 商店搜索即可體驗)。用同樣的方法可以學習使用 AI 數(shù)字人開源項目的代碼。
阿里健康設計官網(wǎng): https://www.alibabahealthdesign.com/
4. 設計師還能搭 AI 算法工作流?
AI 實時渲染一鍵出圖:“ComfyUI”工作流
“ComfyUI + Designdol”l 利用 3D 人偶和“SDXL-Turbo”優(yōu)化算法模型實現(xiàn) 1 步迭代即可 AI 生圖,將大大提升 AI 工作效率。
建設中,圖片僅用于示意
5. AI 應用四步化指南:“SOP”標準化流程
在團隊內(nèi)部署上述這些 AI 能力和平臺,如何讓團隊內(nèi)成員快速上手使用呢?即可通過制定四步化使用指南,幫助團隊成員快速上手 AI 能力,提升 AI 的使用效率和質(zhì)量,創(chuàng)造出更多創(chuàng)意工作。
AI 數(shù)字人技術(shù)的迅猛發(fā)展不僅為各行各業(yè)帶來了前所未有的創(chuàng)新和變革,我們見證了 AI 數(shù)字人在各行各業(yè)的運用以及未來的十大趨勢,從藝術(shù)創(chuàng)作到客戶服務,再到教育和醫(yī)療等領(lǐng)域的職業(yè)角色和工作方式在未來可能徹底轉(zhuǎn)變。AI 的高度適應性和靈活性使其能夠不斷學習和優(yōu)化,從而在各種場景中提供高效、創(chuàng)新的解決方案。
對于設計師而言,這意味著能夠利用 AI 來拓展創(chuàng)意的邊界,實現(xiàn)更加個性化、更具創(chuàng)意的設計。通過 AIGC 技術(shù),設計師和創(chuàng)作者能夠探索新的表達形式和互動方式,從而不斷推動行業(yè)的進步和發(fā)展。因此,AIGC 的涌現(xiàn)不僅是技術(shù)的跨越,更是對職業(yè)邊界的一次重塑,它預示著一個更加智能、互聯(lián)的未來和對設計和創(chuàng)意的革新。
歡迎關(guān)注作者微信公眾號:「阿里健康設計」
復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機派送獎品
2012年成立至今,是國內(nèi)備受歡迎的設計師平臺,提供獎品贊助 聯(lián)系我們
品牌形象設計標準教程
已累計誕生 726 位幸運星
發(fā)表評論 為下方 1 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓