上周我介紹了 gemini 生圖模型,我覺得已經算是實用性很強了,但緊接著 Open AI 就卷起來了,也更新了一波圖像生成模型,然后迅速在全網(wǎng)刷屏。那它的效果到底好不好用呢?是不是被吹的很厲害?我很好奇啊,所以周末趕緊深度實測了一波,先說結論:生成的圖確實比 Gemini 的更好,但也并不完美。
我用 GPT-4o 深度測評了 2 天,當它真的可以指哪打哪后,我實在是不知道怎么形容。這篇文章我先跟大家總結 10 個最好用的使用示例,向你證明它確實是太好用了!
先說明一下,有些人可能會發(fā)現(xiàn)不充會員也能用 GTP-4o,但出來的圖效果完全不行。這是因為免費用戶是用不了新的圖像生成模型的,每天送的那 5 次用的其實是 Dall-E 模型,不是真正的新繪圖模型。
充值后,選擇更多中的“創(chuàng)建圖片”用的才是全新的 GTP-4o 畫圖模型。
所以,我周末花費巨資,先是買了一張?zhí)摂M信用卡,然后又再充值了一個 plus 會員,很順利的就用上了。注意咱們只需要花$20 買 plus 會員就夠了,不用去買那個$200 每個月的,太浪費了。 從我使用的情況來看,plus 會員就能一直生圖,我用了 2 天,沒出現(xiàn)限制的情況。
我測試了以下 10 種場景,各個都非常驚艷!
注意:用的時候,記得先點更多,選擇創(chuàng)建圖片后再輸出提示詞,在提示詞前面會有藍色的“創(chuàng)建圖片”,確保使用新模型且生效。
10 個最常用的使用場景案例
1. 生成組圖
我測試的第一個生成圖片,就是直接挑戰(zhàn)高難度,讓它在一個畫面中同時生成一批帶有對應特征的內容。這在目前其他 AI 生圖能力上基本都超綱了,咱們直接上強度,看看它到底行不行?
提示詞:一張正方形圖片,包含一個 4 行 4 列的網(wǎng)格,網(wǎng)格上有 16 個圖形,背景為白色,從左到右,從上到下。圖形的風格請保持和參考圖一致,列表如下:1、一塊橙色的面包 2、一個白色的星巴克杯子 3、一個草莓蛋糕 4、一瓶牛奶 5、一瓶汽水 6、一杯奶茶 7、一張桌子 8、便利店 9、一只戴著帽子的狗 10、一輛紅色的小汽車 11、一束玫瑰花 12、一把黑色雨傘 13、一雙紅色高跟鞋 14、幾個包子 15、用草書寫的“caiyun”16、辦公樓
效果出來了,16 個元素,位置、內容完全正確,風格和細節(jié)程度還做到了統(tǒng)一,非常棒!
接著,我想把它的風格按我提供的參考圖重新設計下,畢竟在實際項目里,需要的風格比較確定,風格要做到一致性。
提示詞:參考這張圖,把上面的圖風格改成和參考圖一致
這是生成后的效果,開始有一些錯誤了。所以,我不滿足,讓它繼續(xù)改。
有一些修正,但也還是會有問題,所以我想把它改回來,看看有沒有修正回來的可能性,就和在實際工作中指導實習生的感覺。
提示詞:再仔細對照最初的參考圖和設計要求,顏色沒有這么多,有幾個地方的內容出錯了,第 2 個,第 7 個,第 10 個
最終改了幾輪后,有些改回來了,但又出了新的錯誤,我打算就此打住。
雖然它的效果還不是很完美,但總體上拿來稍微改改其實就能用了,已經給了我不小的驚喜,因為我也同時把這個提示詞問了谷歌 gemini,出來的圖是這樣的。
只能說,沒有對比就沒有傷害。
2. 風格轉換
GPT-4o 有類似 ComfyUI 中的 ControlNet 的功能,可以完全復刻參考圖中的人物姿勢,或根據(jù)線稿生成指定風格的圖像。
給大家看下我當時測試的一個例子。
提示詞:把上圖中的畫面轉換為 3D 風格
轉換后的圖,已經非常像了有沒有,這還學啥建模啊?質量也太高了。
眼尖的你可能會發(fā)現(xiàn),生成后的圖和原圖稍微會有點區(qū)別,但這其實是官方刻意為之,不是做不到。因為當我要求它跟原圖一樣時,就違反規(guī)定了。
可能大家在操作的時候,經常會出現(xiàn)一個限制提示,說你違反了他們的規(guī)定。OpenAI 的內容政策特別嚴格地限制“高度擬真人物”的圖像生成,尤其是當提示詞中涉及“肖像還原”“外貌匹配”等字樣時,哪怕是你自己的照片,模型出于防止誤用(例如深度偽造)的政策,也有可能拒絕生成。
所以當出現(xiàn)人物相關需求時,可以用回 comfyUI 或 Gemini,能解決問題。
此時,我已經不滿足于把帶人物的插畫轉成照片,我想把我覺得很美的插圖壁紙也都轉成照片了,那會是什么樣的美景呢?咱們試試效果。
提示詞:把這個場景變成一張寫實照片
這是它生成出來的效果。
當我看到它生成出來的效果時,我真的是被驚艷到了,這效果還原的確實是有點太好了。
我在出這張圖的時候已經是晚上 12 點多了,但我已經沒了睡意,想趕緊多試試,這錢沒白花呀。
我又找了另外一張我很喜歡的風景插圖轉換成了真實美景。
除了轉成通用的卡通風格,還可以在提示詞中加入指定的漫畫家風格,使其更有對應風格的特點。比如我把上一篇文章中生成的美女圖換成海賊王風格會是什么樣的?
提示詞:將參考圖變成海賊王的畫風
再轉成樂高風格,提示詞:將參考圖變成樂高的畫風
我還想把哪吒的 3D 圖改為哆啦 A 夢的風格。
提示詞:將參考圖變成藤子不二雄風格
風格轉換后,有點大雄的感覺啊,哈哈。
3. 生成海報
它能根據(jù)自身的知識庫,生成符合用戶意圖的配圖。
比如我希望它幫我生成一張宇宙百科示意圖。
提示詞:我需要給百科全書畫一張插圖,請幫我用矢量插圖風格生成一張不同類型的星球插圖,需要有對應星球的名字,一句話介紹,背景為白色
這是生成出來的效果,質量很高啊,文字也都是對的。這在之前的生圖模型中,其實很難做到,現(xiàn)在居然這么準確了。
英文沒問題,那中文如何呢?我又試了下
提示詞:把圖中的英文改成中文
發(fā)現(xiàn)基本都能對上,不過也有一些小瑕疵,比如錯別字,筆畫粗細之類的細節(jié)還有提升空間,不過基本上稍微改改就能用了。
然后我又覺得太背景太干,適當加多一些細節(jié)。
提示詞:背景上需要加多一些設計感,能用在書籍的宣傳插圖
背景加的還可以,還能繼續(xù)微調,就像在指導一位設計實習生一般,沒有脾氣,不會疲勞,可以一直改,就問老板們喜不喜歡?設計師們怕不怕!
4. 虛擬試穿
GPT-4o 能把提供的衣服、模特素材,直接合成想要的畫面,完成電商里面經常用到的試穿效果圖。這個能力其實在 comfyUI 和 Gemini 中都能做到,但我發(fā)現(xiàn) GPT-4o 出來的效果似乎會更好。
提示詞:把褲子,帽子,衣服穿到模特身上,并且走在街道上
出來的效果非常好,除了帽子 logo 那稍微有點瑕疵,其他幾乎完全被復刻了過來。瞬間感覺用 comfyUI 搭建的工作流已經失去了意義。
5. 動漫設計
它可以一次性上傳多個角色設定,然后要求 GPT-4o 轉換視角和場景,生成全新的漫畫設定,同時保留漫畫角色特征。
提示詞:讓鳴人和路飛這 2 個角色在中忍考試的場景中激烈的戰(zhàn)斗,畫面中有相應角色的技能特效
直接這樣會提示違規(guī),猜測可能是有版權的問題。按它提示繼續(xù)操作就可以了,依然能保持參考圖的特征,繞過限制。
但在出來的圖片這里,手臂是有點問題的,我們也可以用它的局部修改功能。怎么操作呢?
點擊圖片放大,然后點右上角有一個編輯圖標
點完之后,可以看到一只畫筆,然后把想修改的地方圈出來,寫上提示詞就可以了。
這是優(yōu)化之后的,能看到還是有一些瑕疵,還可以繼續(xù)優(yōu)化,我這里就不演示了。
6. 改圖標風格
在 UI 領域,也可以讓它根據(jù)一種風格生成對應的圖標。咱們設計師經常找參考圖,做情緒版,不就是為了做好風格設計嗎?這下 GPT-4o 也能搞了,而且還挺精細。
比如讓它按找到的設計參考圖,重新設計圖標。
提示詞:按照第 1 個風格圖標重新設計第 2 張圖中的圖標
最后生成的效果,雖然圖片還存在一定的瑕疵,比如透視關系不大對,但這個效果還是非常不錯的。
一整套圖標時也可以出效果
最后的效果也還不錯,除了第一個圖標有瑕疵。
7. 圖像提取
GPT-4o 可以從圖像中摳圖,它還不是一種簡單的摳圖,而是扣出畫面內容,然后幫你做高清修復。
比如我找到了這張圖,水中的海豚其實已經很不清晰了,整個圖片也不到 700px,要想摳出來完整細節(jié)挺不容易的。
提示詞:幫我把畫面中的海豚提取出來
看到了嗎?它不是簡單的摳圖,而是把需要摳圖的海豚完整的摳出,而且還自帶了修復,并且還給了一張透明格式的圖片!
8. AI 找圖
它不僅能按提示詞出圖,還能根據(jù)它自己的知識庫,根據(jù)我的一句話描述,直接把我想要的圖“找”出來。
提示詞:找一張火影里面的小櫻的圖
這是幫我找出來的圖,質量非常高,幾乎沒有啥瑕疵。
9. 老舊照片上色
這個功能其實其他 AI 也有,只是我覺得 GPT-4o 出來的圖更好,尤其是在那些細節(jié)還原度上,甚至景深那些都能比較好的復原。
比如我從網(wǎng)上找到這樣一張照片,我覺得挺有質感的,咱們來實驗一波。
提示詞:為這個老照片變?yōu)椴噬?/p>
這是修復后的照片,細節(jié)還原度拉滿。
10. 一鍵修圖
它的修圖能力,感覺比 PS 還要強,一鍵就把畫面中的人物全干沒了。
提示詞:修改圖片,要求移除畫面中所有人,完全保留畫面中的其他實景細節(jié)
這是修完之后的效果,除了細微處還有點瑕疵外,乍一看,幾乎挑不出毛病。
好了,以上就是我自己在測試中覺得最實用的 10 個使用場景,它還有更多其他用法等待大家去發(fā)現(xiàn),留言區(qū)期待你的發(fā)現(xiàn)和分享。
當前這個模型也不是完美的,它也有一些做的沒那么好的地方。比如對中文的生成還沒那么好,對一些細節(jié)做遷移的時候會有一些瑕疵,限制比較多,出圖速度上也比較慢,而且動不動還限速,挺麻煩的,然后它在一些出圖的美感上也有點不太足,和 Midjourney 稍差一些。但我覺得,這些問題很快就會被迭代解決,畢竟 AI 領域的更新節(jié)奏實在是太快了。
從各家大模型卷的方向來看,都是先保實用性,再提升美感。這和咱們平時做產品的思路一樣,先保證可用,再做到好看。
從天馬行空的驚喜到精準可控的生成,這就是這次升級中最核心的升級內容。
最后說點心里話。
從最初 Midjourney 剛出的時候,就有一種聲音在說設計師要下崗了,不再需要設計師了。但后面這種聲音也隨著實際項目中的應用情況而逐漸回歸理性,設計師還是沒法被取代。而到近期 GPT-4o 出來時,大家更能感覺到工具的好用,設計師下崗論似乎更加強烈。
但我覺得此時如果真的被取代的不是設計師,而是只會畫圖的美工,進而會進一步拉大初級和資深設計師之間的鴻溝。畫圖在實際項目中,只是設計師日程工作中的一部分,項目前期的需求溝通、概念策劃、后期與開發(fā)的對接、還原走查、用戶反饋后的分析、策略調整都是工作,而這個鏈路暫時都需要設計師的介入,沒法完全實現(xiàn) AI 代辦。
雖然我覺得設計師完全被取代不大可能,但我隱約看到一種趨勢:距離直接畫圖越近的設計師,越容易被取代。而在項目中做設計項目管理,做概念策劃的人,負責節(jié)點較多的人會比較難被取代。原因是流程多,組織團隊復雜,需要人的介入就更多,越不容易被 AI 自動化。
所以,苦心鉆研技術可能并不會有出路,關鍵還是策略的思考。如果你想依賴學習到的技術做為壁壘,當你苦心學習了很多年的各種技能,結果被給 AI 說的一句話就打敗了,想想還是有點悲哀的吧。
歡迎關注作者的微信公眾號:「彩云譯設計」
復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網(wǎng)立場,未經允許不得轉載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯(lián)系我們
AI輔助海報設計101例
已累計誕生 726 位幸運星
發(fā)表評論 為下方 14 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓