亚洲av无码av制服丝袜在线,新版福利视频在线观看,婷婷四虎东京热无码群交双飞视频,我把护士日出水了视频90分钟,无码人妻精品一区二区三区99不卡

8.2k 設(shè)計師已圍觀
2024/02/29

太炸裂了!阿里開發(fā)出 AI 圖生視頻模型EMO,1 張圖片加音頻就可以做會說話的頭像視頻!

近期,阿里巴巴智能計算研究所提出了一種新的生成式框架 EMO,是一種富有表現(xiàn)力的音頻驅(qū)動的肖像視頻生成框架,用戶只需提供一張照片和一段音頻文件,EMO就能生成會說話唱歌的AI視頻,實現(xiàn)無縫對接的動態(tài)小視頻,最長時間可達(dá)1分30秒左右。這項技術(shù)的應(yīng)用場景非常廣泛,從電視劇角色的語音合成到音樂視頻中的虛擬表演者,都有可能被AI技術(shù)所取代。

EMO框架使用Audio2Video擴(kuò)散模型,通過三個階段的技術(shù)處理,包括幀編碼、音頻編碼和去噪操作,以及參考注意力和音頻注意力機(jī)制,來生成富有表現(xiàn)力的人像視頻。

目前,EMO 框架上線到 GitHub 中,相關(guān)論文也在 arxiv 上公開。

GitHub:https://github.com/HumanAIGC/EMO

論文:https://arxiv.org/abs/2402.17485

太炸裂了!阿里開發(fā)出 AI 圖生視頻模型EMO,1 張圖片加音頻就可以做會說話的頭像視頻!

太炸裂了!阿里開發(fā)出 AI 圖生視頻模型EMO,1 張圖片加音頻就可以做會說話的頭像視頻!

收藏 關(guān)注話題 點贊 36 生成海報
優(yōu)設(shè)問答有問必答 ?? 回答問題贏獎品
{{ moreBtnTxt }}
閱讀相關(guān)文章
{{comTitle}} {{comSubtitle}}

優(yōu)設(shè)官方微信群

  • 1AIGC自學(xué)交流群
  • 2個人IP運營交流群
  • 3優(yōu)設(shè)私單群
  • 4優(yōu)設(shè)同城搭子群
  • 5優(yōu)設(shè)大學(xué)生交流群
  • 6優(yōu)設(shè)設(shè)計師交流群

添加管理員 招財

微信號: 掃碼添加
嚴(yán)格審核打造高質(zhì)量交流群

太炸裂了!阿里開發(fā)出 AI 圖生視頻模型EMO,1 張圖片加音頻就可以做會說話的頭像視頻!

生成問答海報 我要提問 我來回答