自 24 年 H2 開(kāi)始,AI 視頻行業(yè)以周為單位高速發(fā)展,GenLumio 是我從 24 年開(kāi)始 0-1 規(guī)劃-設(shè)計(jì)-開(kāi)發(fā)的 AI 視頻項(xiàng)目,旨在為大家?guī)?lái)每周最新鮮的 AI 視頻優(yōu)秀作品、產(chǎn)品動(dòng)向。
我計(jì)劃通過(guò)這個(gè)系列的文章選取新鮮產(chǎn)品動(dòng)向、優(yōu)質(zhì)作品案例為大家介紹。
往期速讀:
Runway Gen-4
沉寂了大半年差點(diǎn)被大家忘記的 Runway 終于發(fā)布了新模型 Gen-4,看了很多國(guó)外博主測(cè)評(píng)在處理復(fù)雜動(dòng)作和鏡頭超過(guò)了 Kling 1.6。除了電影鏡頭、寫(xiě)實(shí)風(fēng)格外,這次 Gen-4 也注重了動(dòng)漫風(fēng)格的支持,此外前陣子推出的首幀風(fēng)格化也獲得了不錯(cuò)的傳播效果。
Runway 首席執(zhí)行官 Cristóbal Valenzuela 的作品體現(xiàn)了 Gen-4 在相機(jī)圍繞物體和位置連續(xù)移動(dòng)的能力,配合著唯美音樂(lè)讓人感受到鏡頭敘事的魅力,這里放了 2 個(gè)案例,更多視頻可以訪問(wèn) GenLumio 篩選 Tools - Runway 查看。
Kling 2.0
就當(dāng)我以為這倆月國(guó)產(chǎn) AI 視頻要集體啞火時(shí),Kling 發(fā)布了最新模型,功能上對(duì) Pika labs 進(jìn)行了全面致敬。
看官方聯(lián)動(dòng)博主發(fā)布的效果非常好,2.0 非常擅長(zhǎng)表現(xiàn)大幅度運(yùn)動(dòng)和鏡頭切換的畫(huà)面,但同時(shí)大幅度運(yùn)動(dòng)模糊、瑕疵多缺點(diǎn)也更容易暴露,這可能會(huì)帶來(lái)抽卡次數(shù)的提升。
2.0 目前的定價(jià)非常貴,58 塊錢的月費(fèi)會(huì)員只能抽 6 次卡,還不如沖 Runway 的 Gen-4 試試,對(duì)大部分初級(jí)玩家太不友好。受限于價(jià)格,這次沒(méi)有獲得廣泛的創(chuàng)作者測(cè)試和傳播。
這里是創(chuàng)作者 Alex Patrascu 對(duì) Gen-4、Kling2.0、Veo 2 的測(cè)試結(jié)果,這三個(gè)模型各有特色:
Vidu Q1
Vidu 剛發(fā)布了 Q 系列模型,默認(rèn)支持 1080P,時(shí)長(zhǎng)升至 5s,畫(huà)質(zhì)細(xì)節(jié)提升,支持首尾幀、音效疊加、升級(jí)動(dòng)漫風(fēng)格效果,新用戶有 3 次免費(fèi)使用機(jī)會(huì)。
Pika 玩法更新
Pika 這個(gè)月動(dòng)作不斷,模型能力比不了只能靠花活來(lái)維持聲量了,只要不下牌桌就還有希望。首尾幀視頻從 10s 升級(jí)至 25s(業(yè)內(nèi)唯一一個(gè)),即 Pikadditions 又接連推出 Pikaswaps、Pika Twists 功能,Pikaffects 也更新了不少模版,創(chuàng)作者們基于此開(kāi)發(fā)了很多有趣的視頻。
此前在文章中介紹過(guò)首尾幀的玩法,通??梢杂糜谶B貫的鏡頭轉(zhuǎn)換,延時(shí)攝影、植物動(dòng)物生長(zhǎng)等,下方視頻中的換裝效果也很不錯(cuò)。
Pika Twists 可以通過(guò)文本改變視頻中的一部分內(nèi)容,并保持其余部分不變。
Pikaswaps 通過(guò)上傳原視頻和一張?jiān)貓D片的方式,替換掉視頻中的任意內(nèi)容,可以用來(lái)?yè)Q裝、換發(fā)色。
Pikadditions 通過(guò)上傳原視頻和一張?jiān)貓D片的方式,將元素添加到整個(gè)視頻中。
Luma
Luma 近期在 Ray2 模型上發(fā)力了 Motion、Angle 功能,增加的高速機(jī)械臂鏡頭、全景相機(jī)和空中無(wú)人機(jī)視角挺有意思。
案例來(lái)自 Christopher Fryant
高速機(jī)械臂鏡頭案例 by Rory Flynn
海外作者很多都使用 Luma 創(chuàng)作動(dòng)漫風(fēng)格,Luma 目前單個(gè)視頻 0.5 刀,對(duì)比物美價(jià)廉的國(guó)產(chǎn)替代還是很難下得去手。
介紹完了老牌產(chǎn)品更新,來(lái)看看新產(chǎn)品的動(dòng)向吧,說(shuō)實(shí)話 AI 視頻生成這么卷的賽道還有新產(chǎn)品出來(lái)著實(shí)想不到。
Higgsfield AI
Higgsfield AI 的聯(lián)合創(chuàng)始人兼 CEO Alex Mashrabov 曾是 Snap 的生成式 AI 負(fù)責(zé)人,領(lǐng)導(dǎo)開(kāi)發(fā)了 Snapchat 的 AR 濾鏡、Cameos 功能以及 MyAI 聊天機(jī)器人等產(chǎn)品。他與聯(lián)合創(chuàng)始人 Yerzat Dulat(生成式視頻領(lǐng)域的 AI 研究員)共同創(chuàng)立了 Higgsfield AI。
該產(chǎn)品的特點(diǎn)是提供了超過(guò) 50 種預(yù)設(shè)鏡頭動(dòng)作,如“子彈時(shí)間”、“超級(jí)推拉鏡頭”等,增強(qiáng)視頻的電影感,使用時(shí)支持混合多個(gè)鏡頭效果。訪問(wèn)地址: https://higgsfield.ai/
Magicanimator
Lottielab 是一家初創(chuàng)公司,24 年底推出了 Web 編輯器支持設(shè)計(jì)師能夠輕松創(chuàng)建、編輯和導(dǎo)出 Lottie 動(dòng)畫(huà)。近期他們加入了 AI 視頻的戰(zhàn)場(chǎng),首發(fā) demo 是一段以蘋果 UI 組件為靈感生成的流暢過(guò)渡動(dòng)畫(huà),同時(shí)支持 logo、icon、社交媒體帖子動(dòng)畫(huà)生成?,F(xiàn)在該產(chǎn)品開(kāi)放預(yù)約了,申請(qǐng)地址: https://magicanimator.com/
在其他 AI 視頻產(chǎn)品在卷專業(yè)電影創(chuàng)作、社交媒體玩梗方向時(shí),聚焦設(shè)計(jì)這個(gè)垂直行業(yè),也是個(gè)不錯(cuò)的選擇。
創(chuàng)意轉(zhuǎn)繪
非常喜歡的一位創(chuàng)作者 enigmatic_e 又整了新活,不過(guò)這次的工作流和此前差不太多,使用了 Viggle、AnimateDiff 轉(zhuǎn)繪實(shí)現(xiàn)的效果,這里是他的詳細(xì)制作過(guò)程:
makeitrad 的這個(gè) AI 轉(zhuǎn)繪項(xiàng)目非常厲害,整個(gè)作品工作流非常完整且富有創(chuàng)意。
視頻中的基礎(chǔ)角色由前期手繪完成,然后通過(guò)訓(xùn)練風(fēng)格 Lora 進(jìn)行更多視頻素材的生成;街道中的建筑使用 AI 生圖,圖生 3D 模型并在 3D 軟件中搭建出來(lái);而動(dòng)態(tài)部分則通過(guò)人工繪制關(guān)鍵幀動(dòng)畫(huà),使用 ComfyUI 中的風(fēng)格參考轉(zhuǎn)繪動(dòng)畫(huà)。視頻中分享了完整的創(chuàng)作思路,看完只能說(shuō)一句,太強(qiáng)了!
以上這兩個(gè)案例都是需要一些 3D 基礎(chǔ)才能完成的,那如果不會(huì)建模,也不太會(huì)使用 3D 軟件怎么辦?博主 Ray (movie arc) 的帖子給我提供了另一條思路,通過(guò) MJ 生圖 - 3D 產(chǎn)品生成粗糙模型,裝配預(yù)設(shè)動(dòng)作,最后通過(guò) three.js 加載預(yù)覽。
創(chuàng)意廣告片
來(lái)自 Rufus Blackwell 團(tuán)隊(duì)的真實(shí)商業(yè)廣告作品,融合了 AI 視頻生成和部分實(shí)拍,AI 為團(tuán)隊(duì)節(jié)約了大量特效時(shí)間。
動(dòng)漫風(fēng)格
動(dòng)漫風(fēng)格的優(yōu)秀作品越來(lái)越多了。上一期介紹過(guò) Veo2 是我看到過(guò)最棒的 T2V 產(chǎn)品,現(xiàn)在也支持了 I2V,但目前還在測(cè)試期沒(méi)有對(duì)大眾開(kāi)放。有消息說(shuō)會(huì)在 5 月正式發(fā)布,每天看到海外創(chuàng)作者的測(cè)評(píng)都心癢癢。
最近 RōHKI團(tuán)隊(duì)花費(fèi)了數(shù)月制作的這個(gè)單集作品質(zhì)量非常高,全集使用Runway、Luma 和Veo2制作,音樂(lè)也是精心制作過(guò)的。
視頻中多處使用了 Veo2 制作了高質(zhì)量鏡頭,對(duì)人物的一致性和提示詞的遵循能力達(dá)到了完全不同的高度。
作者分享了一些 Veo2 提示詞例如:
“走到鏡頭前,用紅色記號(hào)筆涂鴉寫(xiě)上‘ROHKI’,另外作者提到“cool quick sketchy VFX camera cuts” and “multiple abstract camera angles”也會(huì)出現(xiàn)驚喜效果
最近我使用 Google 的 Whisk 和 MJ V7 進(jìn)行了生圖測(cè)試,就發(fā)現(xiàn) Google 家的產(chǎn)品對(duì)提示詞的理解能力極強(qiáng),即使是輸入超長(zhǎng)文本也能在畫(huà)面上反饋所有提到的細(xì)節(jié)。這一點(diǎn)上 MJ 完全不是對(duì)手,我對(duì) Veo2 的開(kāi)放使用已經(jīng)迫不及待了。
海外創(chuàng)作者使用 Luma Ray2 和 Vidu 在動(dòng)漫創(chuàng)作上的案例不斷增加,其中 Vidu 的圖片參考功能被創(chuàng)作者們用來(lái)做角色參考和攻法(角色對(duì)應(yīng)的技能)參考。
案例來(lái)自 ai_ani_alchemist
創(chuàng)作者 Bird / AI art and Music 用 Luma 生成的兩個(gè)片段,太帥了,第二個(gè)視頻應(yīng)該是用了延長(zhǎng)。
GenLumio 網(wǎng)站的新內(nèi)容正在設(shè)計(jì)中,新功能是面向主流 AI 視頻產(chǎn)品的參數(shù)對(duì)比,近期我也開(kāi)始了新一輪模型的集中測(cè)評(píng),記錄下最近一段時(shí)間的結(jié)論:
Hailuo、Vidu 目前仍為用戶提供每日積分,如果有少量使用需求的同學(xué)可以選用。
我在 Hailuo 海外版本注冊(cè)了新賬號(hào),獲得了 1000 積分(但是限制 3 天內(nèi)用完)。整體感受 Hailuo 半年前的 I2V live 模型確實(shí)對(duì)于動(dòng)漫風(fēng)格微動(dòng)畫(huà)支持不錯(cuò),但 Luma 和 Vidu 也是強(qiáng)有力的競(jìng)爭(zhēng)者。另外 Hailuo 對(duì)于主體物和環(huán)境之間的交互、細(xì)節(jié)的一致性遵循的不太好,還沒(méi)有達(dá)到 Wan 2.1 給我留下的印象。目前 Hailuo 模型在整個(gè)市場(chǎng)上除了價(jià)格,并不具備優(yōu)勢(shì),只能等新模型發(fā)布了。
Vidu 是當(dāng)下所有產(chǎn)品中生成速度最快的。另外 Vidu 對(duì)動(dòng)漫、寫(xiě)實(shí)風(fēng)格的支持都非常穩(wěn)定,是一款不怎么出錯(cuò)的模型。單視頻價(jià)格在一種國(guó)產(chǎn)產(chǎn)品中也具備絕對(duì)優(yōu)勢(shì)。
研究了 Pika2.0、2.2 和 Kling1.5、1.6 的生成積分消耗規(guī)則,發(fā)現(xiàn)舊模型消耗的積分比新模型更低,這和 Pixverse 是相反的,這可能和模型的升級(jí)、定價(jià)策略有關(guān)系。
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評(píng)論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評(píng)論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國(guó)內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái),提供獎(jiǎng)品贊助 聯(lián)系我們
AI輔助海報(bào)設(shè)計(jì)101例
已累計(jì)誕生 753 位幸運(yùn)星
發(fā)表評(píng)論 為下方 7 條評(píng)論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評(píng) ↓