ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

最近,谷歌一口氣對 AI 模型能力做了一次大升級,其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ,這個模型對設計師來說,實用性很強。

更多新模型的介紹:

然后谷歌這個模型也開放了 API,可以很容易把它接入到 ComfyUI 中,我自己試用后很興奮,忍不住在我的社群里跟大家分享,太驚喜了!

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

可能有朋友還不知道 Gemini 2.0 Flash 是個啥模型?能做什么?

我先簡單總結(jié)下:Gemini 2.0 Flash 最早是在 2024 年 12 月 12 號發(fā)布的,那時候只是作為一個實驗性的發(fā)布,并不對我們普通用戶開放。經(jīng)過幾個月的測試后,在 3 月 12 號已經(jīng)測試通過,正式全面向所有人開放了。它能通過自然語言生成或編輯圖片,和 ComfyUI 有點類似,可控性很好。

可控性好就意味著在工作中將會變得實用,前段時間還跟騰訊的同事聊天,發(fā)現(xiàn)他們現(xiàn)在都已經(jīng)要求團隊的人必須會 ComfyUI 了,招人也是有這個要求,能通過搭建工作流解決工作問題,對這塊很是重視。

模型怎么用?

它的使用很簡單,打開官方這個鏈接 :https://aistudio.google.com/prompts/new_chat

然后選擇 Gemini 2.0 Flash (Image Generation) Experimental 這個模型

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

在主頁上,它給了 3 個示例,可以分別點擊這幾個示例,就大概知道怎么用了。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

先快速說下官方給的這 3 個基礎用法示例

1. 圖片編輯

用最直白的話就能對圖片進行修改。

這里的提示詞是:給牛角面包撒點巧克力。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

我們還可以繼續(xù)用對話對圖片進行編輯,比如“給這張圖上面加點奶油”,如果覺得不大夠,還可以“奶油再多一些”。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

基本上它的生成就是指哪打哪,不會把原圖搞亂,這就跟咱們在 PS 里修圖挺像的了,非常實用,AI 改圖最怕的就是改完之后原圖搞不像了,可控性至關重要。下次你老板再戳你屏幕的時候,直接讓他把意見打成文字,一分鐘給他改好。

2. 創(chuàng)建圖片繪本

可以讓它幫你寫一段故事腳本,并且每一個場景配上一張圖,且每個片段的圖是連貫的。

這里的提示詞官方給了示例:生成一個故事,關于一只小山羊在一個農(nóng)場冒險的故事,每個場景對應生成一張配圖。

點示例后,它很快就生成了 9 個故事場景,然后每個場景都會生成一張統(tǒng)一主角,統(tǒng)一風格的配圖。效果驚人!

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

以后繪本生意估計不好做了。家里小孩想看繪本,咱們自己都能很快出一套,打印出來就能做成冊了。親手做出來給孩子的繪本,成就感肯定不一樣,言傳身教。

3. 生成生日卡片

它還能通過最直白的對話,生成一張海報,文字內(nèi)容我看了下完全正確,直接就能發(fā)給朋友了。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

好,官方的幾個示例都特別簡單,自己去試下絕對能明白,沒什么好說的。下面我要講下它的進階用法,我感覺這才是大招!這也是這個模型讓我覺得最有用的地方,它提供了 API 的方式,可以隨便免費插入到其他應用中,比如 ComfyUI。

我經(jīng)常跟社群的朋友們說,一定要學會 ComfyUI,因為它真的能幫我們解決實際項目問題,但很多朋友的電腦配置帶不動 ComfyUI,有心無力,現(xiàn)在有了谷歌的這個新模型 API,只要你能在電腦上啟動 ComfyUI,你的顯卡多差都無所謂,一樣能通過 ComfyUI 工作流快速生成想要的效果。

具體在 ComfyUI 里怎么接入這個模型?然后又有哪些進階玩法呢?咱們繼續(xù)說。

先啟動 ComfyUI,如果你還不知道怎么安裝,可以看這篇:

打開插件安裝器,搜 Gemini-API ( https://github.com/tatookan/ComfyUI_ssl_gemini_EXP ),注意看最新更新的時間,裝完之后重啟 ComfyUI,它就會生效。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

上面是連單張圖的,如果你還想要通過 2 張圖合并生成,可以裝上這個節(jié)點:ComfyUI Gemini Flash ( https://github.com/ShmuelRonen/ComfyUI_Gemini_Flash )節(jié)點。

然后雙擊 ComfyUI 空白處,搜索 gemini,把這個節(jié)點調(diào)出來

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

前面連上你想調(diào)的圖片,后面接上圖片預覽,就能用起來了。

但在這之前,面板上還有一個 api_key 需要填,這個從哪弄到呢?

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

還記得前面打開的 google AI studio 嗎?怕你忘了,地址再說一次:https://aistudio.google.com/prompts

左上角有一個藍色按鈕,“Get API key” 。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

點中間的創(chuàng)建 API 秘鑰

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

創(chuàng)建完之后,把這個秘鑰復制上

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

貼到 ComfyUI 中剛才創(chuàng)建的節(jié)點里

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

到這配置就完成了,沒任何難度。

當結(jié)合 ComfyUI 后,它能玩的東西就非常多了。相當于把之前可能需要一堆節(jié)點才能完成的事,現(xiàn)在用谷歌一個節(jié)點也能做。我給大家示例一些,其他的大家再發(fā)揮下想象力,把你想到的有意思的用途放在評論區(qū)。

① 給圖片去水印

本來我想找一張車的白模給大家演示,但找到的圖是帶水印的,那就先去掉水印。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

提示詞:把這張圖中的水印去掉,只保留車。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

修改結(jié)果,發(fā)現(xiàn)它不僅把水印給去掉了,還把位置和光影移動到了更好的位置,圖片的清晰度和質(zhì)量都幫忙提升了。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

② 上色+換背景

有了高質(zhì)量白模圖,咱們繼續(xù)讓這張圖變得更真實。

給這張圖上個材質(zhì),換個環(huán)境

提示詞:給圖中的車上個色,讓它看起來更真實好看,車開在戶外的公路上,路兩邊有山林,保留車的角度和特征。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

結(jié)果還行吧,基本特征算是繼承了下來。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

③ 換衣服

給車上完色,咱們接著來做點更實用的事,給模特換衣服,這在電商領域經(jīng)常用到。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

提示詞:給這位美女換一件白色襯衫

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

換完衣服,動作稍微有些變化,但畫面的背景,人物的其他特征基本上得到了保留。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

④ 給一件衣服做一張廣告圖

假如我們有一件衣服需要把它做成一張宣傳圖。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

提示詞:給這件衣服添加一個小孩子模特,做出一張電商廣告圖,保持衣服的一致性

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

⑤ 給人物換個表情

以前在 ComfyUI 中換表情,調(diào)起來挺麻煩的,現(xiàn)在接入這個 API 后,換表情不要太容易,而且效果還不錯,人物特征保持的特別好。

比如我拿哪吒來嘗試,讓他張嘴笑起來。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

提示詞:讓圖片中的人物大笑起來,嘴巴需要打開,保持人物的特征不變。

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

修改結(jié)果

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

上面這些操作,你也可以不用 ComfyUI,直接用谷歌的那個對話框也能搞定,只不過在 ComfyUI 里有批量或者其他更多操作的時候,會更方便一些。

AI 的發(fā)展,其實一直都在降低技術學習成本,ComfyUI 學習對很多人來說太復雜,我就知道早晚會把它的難度打下來,只是沒想到這么快。

果然在 AI 世界,每天都在發(fā)生巨變,我們要做的就是保持關注,積極接納,多用多學習。一起適應這個正在發(fā)生巨變的世界。

歡迎關注作者的微信公眾號:「彩云譯設計」

ComfyUI 難度驟降一倍!揭秘谷歌Gemini 2.0 Flash的史詩級更新

收藏 91
點贊 53

復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。