首席爆料師邀你回答

8.2k 設(shè)計師已圍觀

2024/02/29

太炸裂了！阿里開發(fā)出 AI 圖生視頻模型EMO，1 張圖片加音頻就可以做會說話的頭像視頻！

近期，阿里巴巴智能計算研究所提出了一種新的生成式框架 EMO，是一種富有表現(xiàn)力的音頻驅(qū)動的肖像視頻生成框架，用戶只需提供一張照片和一段音頻文件，EMO就能生成會說話唱歌的AI視頻，實現(xiàn)無縫對接的動態(tài)小視頻，最長時間可達(dá)1分30秒左右。這項技術(shù)的應(yīng)用場景非常廣泛，從電視劇角色的語音合成到音樂視頻中的虛擬表演者，都有可能被AI技術(shù)所取代。

EMO框架使用Audio2Video擴(kuò)散模型，通過三個階段的技術(shù)處理，包括幀編碼、音頻編碼和去噪操作，以及參考注意力和音頻注意力機(jī)制，來生成富有表現(xiàn)力的人像視頻。

目前，EMO 框架上線到 GitHub 中，相關(guān)論文也在 arxiv 上公開。

GitHub：https://github.com/HumanAIGC/EMO

論文：https://arxiv.org/abs/2402.17485

太炸裂了！阿里開發(fā)出 AI 圖生視頻模型EMO，1 張圖片加音頻就可以做會說話的頭像視頻！

AIGC AI神器 AI視頻人工智能阿里巴巴

收藏 關(guān)注話題 點贊 36

立即查看 AIGC 的解決方案

超方便！3個設(shè)計師都在用的免費AI配色工具

AIGC AI神器閱讀 4.3w

查看詳情

優(yōu)設(shè)問答有問必答 ?? 回答問題贏獎品

4.2k 設(shè)計師圍觀了該問題

各位設(shè)計師，2023年度個稅匯算今起開始，大家可以申請辦理退稅啦！

< 上一篇

返回問答首頁

2.3k 設(shè)計師圍觀了該問題

Lightricks 官宣，生成式AI電影制作平臺—LTX Studio，今年有望看到AI制作的電影上映嗎？

下一篇 >

閱讀相關(guān)文章

設(shè)計史太濃

2024/02/27

閱讀 2.1w

AI創(chuàng)作

從 Sora 的發(fā)展史，聊聊設(shè)計師如何面對 AI 焦慮

此文希望通俗點跟大家談一下Sora，包括它的誕生過程，背后團(tuán)隊，技術(shù)原理，五大絕招，三大局限，及面對AI沖擊的時候，設(shè)計行業(yè)的一點思考。

AIGC AI繪畫

13分鐘閱讀

陳子木

2023/01/29

閱讀 2.3w

神器推薦

第四波！2023年1月精選實用設(shè)計干貨合集

這是 2023 年 1 月的第 4 波干貨！想必很多設(shè)計師同學(xué)都已經(jīng)回到崗位開工了吧？那么這些新的設(shè)計工具和素材，就有用武之地了！

人工智能人工智能神器

6分鐘閱讀

夏花生

2024/08/20

閱讀 16.3w

AI創(chuàng)作

Flux.1 生態(tài)最新梳理！新增 4 款新模型，支持 Controlnet 和 Lora （附模型/工作流文件）

我花了一整天的時間，詳細(xì)梳理了目前 Flux 生態(tài)內(nèi)的各種模型、插件資源，并整理了對應(yīng)的使用方法，看完之后你肯定會對 Flux 有一個全面深入的了解。

AIGC AI繪畫

15分鐘閱讀

夏花生

2022/08/03

閱讀 18.5w

AI創(chuàng)作

人工智能快速出圖！盤點 4 款大廠出品的 AI 繪畫神器

Google、微軟、Meta 三家互聯(lián)網(wǎng)科技公司紛紛推出新的 AI 圖像工具，很多新的技術(shù)都令人眼前一亮，一起來看看。

AIGC AI神器

13分鐘閱讀

阿真Irene

2025/04/29

閱讀 2.3w

AI創(chuàng)作

如何用Vidu+飛書批量生成AI視頻？完整工作流+模板免費領(lǐng)取！

4步打通AI視頻批量生成，效率提升300%

AIGC AI視頻

13分鐘閱讀

{{comTitle}} {{comSubtitle}}

關(guān)于我們

優(yōu)設(shè)是國內(nèi)專業(yè)設(shè)計師平臺，2012年創(chuàng)辦至今，作為行業(yè)風(fēng)向標(biāo)，我們13年來專注于設(shè)計師創(chuàng)作者的學(xué)習(xí)成長交流。通過優(yōu)設(shè)網(wǎng)、優(yōu)優(yōu)教程網(wǎng)、優(yōu)創(chuàng)網(wǎng)分別沉淀優(yōu)質(zhì)內(nèi)容。是一家集齊媒體、內(nèi)容、服務(wù)的多元化平臺。MCN矩陣@優(yōu)設(shè)AIGC 在微博、微信、小紅書、抖音、B站布局，全網(wǎng)粉絲過千萬。

菜單 優(yōu)設(shè)網(wǎng)uisdc.com 優(yōu)設(shè)網(wǎng) - 學(xué)AI設(shè)計上優(yōu)設(shè)

您還未登錄

登錄后即可體驗更多功能

首席爆料師 邀你回答

立即查看 AIGC 的解決方案

AIGCAI神器閱讀 4.3w

Wo~本文的評論還空著，快來搶沙發(fā)

4.2k 設(shè)計師圍觀了該問題

各位設(shè)計師，2023年度個稅匯算今起開始，大家可以申請辦理退稅啦！

< 上一篇

2.3k 設(shè)計師圍觀了該問題

Lightricks 官宣，生成式AI電影制作平臺—LTX Studio，今年有望看到AI制作的電影上映嗎？

下一篇 >

設(shè)計史太濃

陳子木

夏花生

夏花生

阿真Irene

優(yōu)設(shè)讀報 2025年09月21日 星期日

Suno v5 音樂模型即將登場！AI 音樂創(chuàng)作迎來“變革性”升級

騰訊混元新技術(shù)給大模型 “去油”！讓 AI 生成圖像更真實

法國 AI 公司 Mistral 重磅推出開源推理模型 Magistral Small 1.2

抖音上線 AI 求真功能！大模型實現(xiàn)謠言快速識別

全球首個 AI 全棧工程師 Orchids 發(fā)布！能力超越 Devin 等競品

近期熱門問題

寶馬28年以來首次更新品牌標(biāo)識，啟用現(xiàn)代化扁平化新標(biāo)，你覺得新LOGO設(shè)計如何？

6位設(shè)計師參與回答

賽百味俄羅斯業(yè)務(wù)更名為Subjoy，全新LOGO亮相，哪一款更具設(shè)計感？

5位設(shè)計師參與回答

做設(shè)計這些年，你學(xué)到的最重要的是什么？

4位設(shè)計師參與回答

王老吉國際罐首發(fā)：WALOVI標(biāo)識融合東西方美學(xué)，設(shè)計師們怎么看？

4位設(shè)計師參與回答

可靈AI推出2.1模型首尾幀功能，視頻生成效果提升235%！

3位設(shè)計師參與回答

別再為App圖標(biāo)肝腦涂地了！這個AI神器讓你秒變設(shè)計大師

3位設(shè)計師參與回答

優(yōu)設(shè)官方微信群

添加管理員 招財

微信號: 掃碼添加

嚴(yán)格審核打造高質(zhì)量交流群