最近AI視頻生成領(lǐng)域真的是大招頻頻啊~~最開(kāi)始是Runway發(fā)布了 Gen-2,Pika 1.0接踵而至,而google前不久剛發(fā)布了多模態(tài)模型Gemini,現(xiàn)在Google繼續(xù)放大招,發(fā)布了一個(gè)基于大語(yǔ)言模型的視頻生成技術(shù):VideoPoet
這款 LLM 應(yīng)用可以執(zhí)行多種視頻生成任務(wù),例如文本生成視頻、圖像生成視頻、視頻風(fēng)格化以及修補(bǔ)和擴(kuò)展功能,甚至視頻到音頻的轉(zhuǎn)化 VideoPoet 都能勝任。
這一次是對(duì)多模態(tài)大模型革命性的推動(dòng),大家覺(jué)得呢?