前言
2022 年底 ChatGPT 發(fā)布,各行業(yè)一度陷入恐慌,其中 AI 生圖技術的效果和速度令人們驚嘆,以創(chuàng)意為核心競爭力的設計師群體首當其沖。
然而很快我們發(fā)現(xiàn),AI 在模仿和融合設計方面的能力非常驚人,在靈感激發(fā)和設計過程中善用 AI 工具能極大提高創(chuàng)意效率。在廣告營銷領域,國內(nèi)外品牌紛紛將 AIGC 融入營銷活動,用傳統(tǒng)創(chuàng)作手段與 AI 技術碰撞出新的視覺效果甚至新的產(chǎn)品。
更多AIGC實戰(zhàn)案例:
MEUX 的運營設計師們在百度 APP 的渠道增長方向也進行了一次 AI 應用的突破,我們首次基于實際業(yè)務去學習使用 AI,借助 AI 能力生產(chǎn)海量的圖片物料,通過網(wǎng)絡廣告位推送給用戶,從而實現(xiàn)用戶增長的目標。
網(wǎng)絡廣告投放的優(yōu)勢在于千人千面,這就需要持續(xù)供給大量的廣告創(chuàng)意。過去這項工作全部由人工完成,設計師需要基于一些圖片素材、用大家熟悉的 PS、拍攝等方式進行創(chuàng)意設計。由于每周要供給幾千個新物料,而耗時費力地制作精致美觀的圖片又未必能帶來更高的收益,因此逐漸發(fā)展成數(shù)量級遇瓶頸且物料視效不優(yōu)的局面。在控成本的情況下,想要把物料數(shù)量再提升一個量級、同時提高美觀度,這幾乎是不可能的事情。而如今的 AI 技術讓我們看到了希望。
我們與產(chǎn)品和研發(fā)經(jīng)過一段時間的研究,使用 Stable Diffusion 生產(chǎn)出了海量的圖片物料,產(chǎn)能和畫面質(zhì)量都超越了傳統(tǒng)人工生產(chǎn)模式。
對于百度 APP 的廣告物料來說,使用 AI 生成可用的圖片并沒有想象中那么容易,我們在嘗試 Stable Diffusion 的初期屢屢翻車。
在這個業(yè)務場景中,目標是向用戶推廣百度 APP 的搜索功能,我們需要基于搜索 query(即用戶搜索詞)生成物料的底圖,例如“家常肉丸子”、“如何給汽車加油”、“面霜推薦”、“麻辣小龍蝦的做法”等等,內(nèi)容類型包羅萬象。
Stable Diffusion 界面的上手難度略高于 Midjourney,但基本原理相同,于是我們針對具體 query,選擇適合的大模型和 Lora、擴充正反提示詞并反復調(diào)參,這樣可以順利生成一些效果不錯的圖片。
但也有不少 query 難度較大,對于 AI 生不出來的,嘗試用圖生圖、Controlnet 等插件,攻克一個個 badcase。當我們經(jīng)過幾個小時的研究終于獲得一盤相對靠譜的麻辣小龍蝦的時候,激動之余也感受到駕馭 AI 是有一定門檻的,也發(fā)現(xiàn)對于中國本土事物,市面上的 AI 大模型大多水土不服,想要生成正確的圖像仍有一定難度。
在了解了 AI 的能力現(xiàn)狀之后,業(yè)務方開始嘗試小規(guī)模生產(chǎn),選擇一批 AI 相對擅長的 query,由設計師選定適合的大模型并撰寫完整的提示詞,再由產(chǎn)品和研發(fā)如法炮制生成上千張圖片后投放到線上,看上去似乎解決了量產(chǎn)的問題。
但是,百度的搜索 query 量級巨大,有幾十萬個,我們初期研究的十幾個 query 只是九牛一毛,用這種手工作坊的方式逐個定制提示詞顯然是不現(xiàn)實的。
幾十萬個 query,似乎又是一個不可能完成的任務。
我們重新從 query 的分類入手,由設計師針對一些高收益的垂類提煉相應的提示詞模板,每套模板不包含畫面主體提示詞,僅用來穩(wěn)定控制畫面的色彩和視角、物體的質(zhì)感、人物的情緒等等,再由研發(fā)批量添加主體提示詞、接入 Stable Diffusion 批量生圖。
設計師在撰寫調(diào)試提示詞模板時,需要針對不同垂類的特點做差異化定制,一方面要確保圖片內(nèi)容正確、另一方面要控制風格與這類 query 相匹配。比如,針對「生產(chǎn)制造」類,選用“Realistic_Vision_V5.0.safetensors”等寫實畫面的大模型,添加“工業(yè)”、“機械”、“光滑”等提示詞,體現(xiàn)機械設備的特征;而針對「醫(yī)美」類,選用“braBeautifulRealistic_v40”等擅長繪制亞洲美人的大模型,使用“女孩”、“青春活力”等正向詞來呈現(xiàn)健康美麗的人像,用“變形”、“扭曲”等反向詞避免人體畸形。
用這樣的提示詞模板有了第一批量產(chǎn)圖片后,我們再觀察圖片效果問題做進一步調(diào)優(yōu)。
比如「旅游出行」類,第一版提示詞模板量產(chǎn)出來的圖片看上去還不錯,但是數(shù)據(jù)表現(xiàn)不理想,我們通過觀察分析發(fā)現(xiàn)整體色調(diào)偏暗、視角不佳,在廣告投放場景中不吸睛。于是我們在正向詞和反向詞中都加入了控制色彩和視角的提示詞,將畫面色調(diào)從灰暗調(diào)至鮮艷、視角從遠景鳥瞰拉到中景平視,把好看的風景送到用戶面前,更容易吸引用戶點擊。
搞定了底圖的量產(chǎn)方式,還有另一個構成要素——模板,模板用于承載文案和引導按鈕等元素,套在底圖上組成圖片物料。其中的文案要展示中文,但目前的AI無法生成,因此需要由設計師制作,但同樣的問題是,為幾十萬個query定制化地設計模板也是不現(xiàn)實的。
因此,我們?nèi)匀皇菑?query 分類入手,針對每個垂類設計比較通用的模板樣式,再由研發(fā)用技術手段批量套用到底圖上。
仍然以「旅游出行」類為例,我們根據(jù)垂類特點設計了兩種模板:對于地標建筑類辨識度高的圖片,搭配上下結構的模板、主要用畫面中的主體吸引用戶;而大場景自然風光類圖片通常沒有明顯視覺焦點,適合搭配居中結構的模板、用大字文案快速抓住用戶眼球促進轉化。用這個思路還可以繼續(xù)細分擴充模板樣式,套用到 AI 生成的各類底圖上,在量產(chǎn)基礎上實現(xiàn)創(chuàng)意多變。
在量產(chǎn)投放過程中我們發(fā)現(xiàn),物料數(shù)量與數(shù)據(jù)效果不一定正相關,而底圖畫面的精美度與數(shù)據(jù)效果也并不總是正相關,因此我們也在積極地研究提升數(shù)據(jù)的方法,設計師針對業(yè)務的關鍵數(shù)據(jù)指標,從視覺方面和用戶視角思考更多解法。
比如通過拆解物料要素可見,文案也十分重要,特別是對于相對抽象的 query,例如「教培類」“雅思培訓班”,圖片很難直觀體現(xiàn)內(nèi)容,主要靠大字文案吸引點擊,一方面我們在模板的文案樣式上做更加醒目的設計,另一方面文案的內(nèi)容也需要具有一定情緒激勵作用,例如“雅思不過關?培訓機構怎么選?”更能打中用戶痛點并且更有互動感,但目前 AI 生成的文案在這方面表現(xiàn)不佳,因此文案也是未來可研究的一個子方向。我們從用戶視角輸出方法,不斷提高 AI 自動化程度和生產(chǎn)質(zhì)量,為業(yè)務帶來增長收益。
同時,設計師也在主導通過 AB 實驗持續(xù)摸索“好物料”的特點,提煉底圖、模板、文案的設計要點,將適合業(yè)務場景的經(jīng)驗沉淀到 AIGC 量產(chǎn)上。
一切都才剛剛開始,我們看到目前的 AI 能力還無法實現(xiàn)全自動化,現(xiàn)階段需要由設計師使用專業(yè)術語跟 AI 對話,并通過分析實際應用場景和一次次的數(shù)據(jù)驗證反推出相應的解法再操控 AI,不斷摸索人機協(xié)作的方式去落地應用。
當下,設計師掌握 AI 工具已成為一項新的基礎能力,我們也要具備更強的業(yè)務思維,才能用新工具發(fā)揮出更大的商業(yè)價值。同時我們也會持續(xù)關注 AI 的發(fā)展,應用最新的技術能力做更多嘗試,在 AI 的浪潮中將更多的不可能變成現(xiàn)實。
歡迎關注作者的微信公眾號:「百度MEUX」
復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網(wǎng)立場,未經(jīng)允許不得轉載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機派送獎品
2012年成立至今,是國內(nèi)備受歡迎的設計師平臺,提供獎品贊助 聯(lián)系我們
品牌形象設計標準教程
已累計誕生 726 位幸運星
發(fā)表評論 為下方 2 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓