GPT4o的多模態(tài)生圖前天上線之后。
經(jīng)過兩天的發(fā)酵,含金量還在不斷提升。
在我的群里,已經(jīng)能看到越來越多的,進(jìn)入到實(shí)際生產(chǎn)環(huán)節(jié)的例子。
之前的ChatGPT-4o介紹:
比如@銀海的直接做商品圖的翻譯和合成,這是原來的算法,很難做的效果,但是現(xiàn)在,有手就行。
非常復(fù)雜的電商流程,一張?jiān)紙D,換產(chǎn)品換臉換衣服。
比如@歸藏的直接把UI圖放樣機(jī)里面的例子,如果做過UI或者產(chǎn)品設(shè)計(jì)的朋友肯定都知道,以前我們在做做展示,或者做匯報(bào)的時候,經(jīng)常做樣機(jī)做的挺痛苦的。
比如給他頭像,畫的兩套表情包,是可以直接上架到微信表情商店的那種。
來自一個頂級消費(fèi)品公司的電商設(shè)計(jì)團(tuán)隊(duì)負(fù)責(zé)人@黃花魚,用GPT-4o來直接做之前非常流行的3D品牌海報(bào)。
比如我一個很喜歡的小紅書AI博主@Rico有三貓,用GPT-4o給她做小紅書封面。
也用GPT-4o直接做商品圖翻譯出海。
群友@默月僉在用GPT-4o出蜜蜂的解剖科普圖。
一個很專業(yè)的公眾號AI博主@阿真lrene,不僅用GPT-4o生成復(fù)雜的漫畫,還能摳圖,一鍵直出透明通道的PNG圖。
干死各種摳圖軟件的不是更牛逼的摳圖軟件,而是大模型。。。
還有朋友@不知名網(wǎng)友虎子哥,用GPT-4o給他自己家的房子裝修。。。
還有一些我確實(shí)不知道源頭的但是被傳播的蠻廣的例子(如有作者,歡迎評論區(qū)認(rèn)領(lǐng))。
給幾個家具做一個展示圖,這個場景在電商領(lǐng)域無敵。
之前我寫可靈的AI模特的時候,很多人問,能不能讓模特帶首飾?現(xiàn)在,可以了。
還用它,直接P圖,消除人物。
老照片一鍵修復(fù)+上色。
甚至,還可以模仿字體做自體設(shè)計(jì)。
在GPT-4o的沖擊下,N多的設(shè)計(jì)師和創(chuàng)業(yè)者,都有點(diǎn)emo了。
比如就有大佬在X上感嘆道:
朋友圈里還看到了一張圖,是glif的老板,在X上發(fā)的。
紀(jì)念ComfyUI,紀(jì)念一切的AI圖像工作流。
OpenAI的一次更新,又屠殺了一堆公司。
又一次深刻的闡明了那句《三體》中的經(jīng)典臺詞:
我消滅你,與你無關(guān)。
GPT-4o的沖擊當(dāng)然是有,但是,他的上限在哪?能做到什么地步?真的能徹底替代ComfyUI的AI圖像工作流嗎?
我想弄清楚這個答案。
首先我覺得我還是要跟大家非常簡單的用一兩句話解釋一下ComfyUI,讓大家知道這玩意是個啥,我們才好繼續(xù)往下聊。
ComfyUI是一個非常專業(yè)的工作流工具,不局限于AI繪圖,AI視頻啥的也都可以往里面接。他的界面大概是這樣的,很像電路板。
這個就是在Liblib上搭的ComfyUI工作流。
它是以節(jié)點(diǎn)方式,把各個工具、各個模型給串起來,形成一整套的工作流,比如一張圖進(jìn)去,經(jīng)過各種節(jié)點(diǎn)和插件,輸出一個完全風(fēng)格不同的AI視頻,這都是OK的。
坦率的講,我不是ComfyUI的專家的,做過的工作流也不多,我覺得在這個領(lǐng)域,我并沒有那么強(qiáng)的發(fā)言權(quán),所以我去請教了一下我的1個好朋友,AI繪圖大神@煉丹師忠忠。
我想聽聽,他的看法。
首先是,GPT-4o對電商設(shè)計(jì)的沖擊到底有多大?
我跟忠忠聊了很久。
最后得到的結(jié)論,跟我自己在設(shè)計(jì)行業(yè)里感受到的水溫差不多。
對于普通水平的電商設(shè)計(jì)師,肯定是有打擊的,他們原有的技能水平也就只能產(chǎn)出跟gpt4o差不多的圖,相對來說意義不大了。
上游的運(yùn)營專員可以自己操作工具來生產(chǎn)一樣質(zhì)量的圖。跟被沖擊的插畫師類似,可能會變?yōu)閹兔π扪a(bǔ)gpt4o產(chǎn)出的圖的bug,還有疊加原圖部分細(xì)節(jié)上去加強(qiáng)細(xì)節(jié)還原(類似于高低頻修復(fù)流程)。
生產(chǎn)成本降低后,需求量會變大,原本用不起各種華麗背景圖包裝的商家,現(xiàn)在也用的起了。
從效果上極簡操作就能生圖的工具有美圖設(shè)計(jì)室等一堆工具,GPT4o只是在某些效果方面更進(jìn)一步而已,對于專業(yè)級的實(shí)際商業(yè)生產(chǎn)的影響可能沒有那么大。
而從視覺設(shè)計(jì)角度,對現(xiàn)有的整個開源生態(tài),反而是利好作用。
忠忠舉了自己設(shè)計(jì)的公司IP的例子。
現(xiàn)在,可以一句話把IP的3D模型,直出到品牌海報(bào)上,不需要走以前的3D建模+渲染了,大大節(jié)省了時間。
同時,更有趣的一點(diǎn)是,GPT-4o可以根據(jù)一張IP草圖,來生成這個IP的各角度視圖。
而這些圖,會進(jìn)一步推動flux等開源模型的微調(diào)版本的效果。
你可能會問,都有GPT-4o了,為什么還要去微調(diào)flux,在ComfyUI搭工作流用呢?這不是脫褲子放屁多此一舉呢?
其實(shí)有兩個原因。
數(shù)據(jù)隱私性和精準(zhǔn)性。
數(shù)據(jù)隱私很好解釋,就是GPT-4o是一個閉源的模型,后面最多最多也就是開放一個API,讓大家接到ComfyUI里面去用,但是,就OpenAI這個尿性,我們給過去的東西,大概率就成他后續(xù)的訓(xùn)練素材了。
舉個例子,《流浪地球3》2027年上映,要是現(xiàn)在美術(shù)組把核心概念圖或者設(shè)定圖直接灌給GPT-4o做一些處理,到時候,《流浪地球3》電影還沒上映,設(shè)定圖你可以直接在GPT-5o里面讓它畫出來,這特么就炸了。。。
所以,數(shù)據(jù)隱私性至關(guān)重要,在真正的生產(chǎn)環(huán)境里,特別是一些大廠里,必須只能用本地的ComfyUI搭,真正的輸出,必須是本地環(huán)境,用開源的模型。
所以,這個時候,我們就可以用一些不敏感的信息,扔給GPT-4o,來輔助生成數(shù)據(jù)集,反過來微調(diào)自己的flux模型,這個點(diǎn),真的很有用。
精準(zhǔn)性其實(shí)也很簡單,我們回過頭來看忠忠用GPT-4o輸出的自己家IP的海報(bào)。
先不說其他的細(xì)節(jié)了,這幾處,你是能發(fā)現(xiàn)一些明顯的BUG的。
這其實(shí)在生產(chǎn)環(huán)境里,這種BUG是品牌方覺得不可能接受的,就想你給一個手機(jī)產(chǎn)品做廣告,你把人手機(jī)弄變形了,你跟人說不行AI出得就是這樣的,你看對面會不會把你掛在電風(fēng)扇上轉(zhuǎn)著打。
而這個時候,用Flux專門微調(diào)的Lora,是可以完美的解決這種精準(zhǔn)性和一致性的問題的。
這其實(shí)就是普通設(shè)計(jì)場景和專業(yè)設(shè)計(jì)場景的區(qū)別。
GPT-4o當(dāng)然可以替代大部分的普通工作流,會讓ComfyUI里一大批的工作流失去價值,但是這就不代表,ComfyUI失去價值了。
很簡單的一點(diǎn)是,在專業(yè)的設(shè)計(jì)工作里,純對話式的簡單界面滿足不了復(fù)雜專業(yè)的需求的。
就像你問一個專業(yè)設(shè)計(jì)師,為什么設(shè)計(jì)是用PS做設(shè)計(jì),而不用美圖秀秀來做設(shè)計(jì),對方只會把你當(dāng)傻子。
在真正的專業(yè)的AI設(shè)計(jì)工作里,可控性,很多時候非常的重要。
需要精確的規(guī)定重繪區(qū)域,需要精確的調(diào)節(jié)風(fēng)格效果,出圖尺寸比例等,所以在專業(yè)生產(chǎn)中需要精確調(diào)節(jié)的細(xì)節(jié),不能指望OpenAI全做成功能。
還有前后處理流程,比如說前置的裁剪,摳圖,語義識別,后置的比如對圖片的放大,貼回原圖細(xì)節(jié)(高低頻修復(fù)),再接入其他工作流繼續(xù)處理等。
自動化一鍵完成的效率要比多輪對話高很多。
包括在一些精準(zhǔn)度要求高的產(chǎn)品和場景上,GPT-4o目前還達(dá)不到專業(yè)級的水準(zhǔn)。
看個例子。
比如我們要把問界M9這款車,換到另一個場景里。車這種產(chǎn)品,跟筆、戒指、香水等等要求的精細(xì)度,完全不一樣。
這是GPT-4o出的圖。
而如果我們用大佬的牛逼工作流呢?
生成出來的效果在整體比例和質(zhì)感上,是更好的。
對比應(yīng)該非常直觀了。
這里我要給自己疊個甲,我并不是在這里鼓吹,GPT-4o不行,ComfyUI的效果可以吊打GPT-4o。
如果是這樣的話,我也不會連更兩篇,來給大家看一看,GPT-4o,有多酷,有多強(qiáng)。
我想說的是,GPT-4o,跟當(dāng)年的SD、Midjorney、Runway、可靈等等AI工具是一樣的。
會無差別替代所有這個行業(yè)里面的初級執(zhí)行職位。
屠殺所有曾經(jīng)在工程層面對大模型進(jìn)行的一些優(yōu)化。
然后,一點(diǎn)一點(diǎn)侵蝕更上層的建筑。
它更像是一層層洶涌上漲的潮水,將整個AI圖像領(lǐng)域原有的邊界打得支離破碎。
都說做AI產(chǎn)品,要看到大模型的邊界,在邊界之外的安全地帶做。
但是現(xiàn)在,你根本不知道邊界在何方。
那些看似高聳的技術(shù)壁壘與工作流程,如果只是基于簡單組裝或者初級執(zhí)行的邏輯,正在被GPT-4o以近乎暴力的方式消解。
絕大多數(shù)機(jī)械式的制作工作,一旦被強(qiáng)大的多模態(tài)理解與生成替代,就會像那些轟然倒塌的圍墻一樣,被歷史的風(fēng)塵輕易覆蓋。
有沒有一種第一次工業(yè)革命時候,機(jī)器代替手工勞動的即視感?
歷史總是在不斷的重復(fù)。
可一如上文所言,這絕不代表ComfyUI之流就會被完全淘汰。
在工業(yè)級、專業(yè)級的深度工作流里,人們對數(shù)據(jù)安全、設(shè)計(jì)精度、可控度的需求不可能憑空消失。
那種圖像與視頻的多次處理、分層輸出、版本管理、腳本化批量運(yùn)行、自動化節(jié)點(diǎn)銜接,只要是大型企業(yè)或核心團(tuán)隊(duì),都會很在意。
GPT-4o會在C端和中小B端市場里摧枯拉朽,取代大量低端或者重復(fù)性工作。
而ComfyUI、Flux、ControlNet等開源生態(tài)則在更專業(yè)的領(lǐng)域繼續(xù)進(jìn)化,利用它們精細(xì)、可控、可離線部署的特性,為高端客戶或機(jī)密項(xiàng)目提供服務(wù)。
這氣勢就像云端辦公與本地辦公的關(guān)系一樣,前者無限便捷,后者安全可控。
也如同家用轎車與頂級跑車的分別,各自目標(biāo)用戶并不沖突。
GPT-4o也一定會不斷進(jìn)化,去擴(kuò)大自己的邊界蠶食更多的場景。
開源生態(tài)也會有各種可以復(fù)刻效果的模型、產(chǎn)品出來,從而進(jìn)行私有化。
沒什么能夠阻止浪潮向前。
要么成為浪潮的追隨者,要么成為浪潮的推手。
這二者,都肯定比做一塊沉在海底的礁石,要精彩得多。
你說是嗎。
以上,既然看到這里了,如果覺得不錯,隨手點(diǎn)個贊吧,我們,下次再見。
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎品
點(diǎn)擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機(jī)派送獎品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計(jì)師平臺,提供獎品贊助 聯(lián)系我們
AI輔助海報(bào)設(shè)計(jì)101例
已累計(jì)誕生 726 位幸運(yùn)星
發(fā)表評論 為下方 20 條評論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓