騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

導(dǎo)語:現(xiàn)今,許多 B 端設(shè)計(jì)師在日常設(shè)計(jì)中難免會(huì)遇到各種運(yùn)營 3D banner 設(shè)計(jì)需求。在設(shè)計(jì)過程中,他們不僅需要費(fèi)盡心思構(gòu)思各種造型,還要不斷進(jìn)行重復(fù)渲染,而有時(shí)渲染結(jié)果也難以令人滿意。本文旨在介紹一種基于 Stable Diffusion 混合 AI 的 B 端 3D Banner 設(shè)計(jì)方法和流程,可供任何對(duì)該領(lǐng)域感興趣的人進(jìn)行實(shí)驗(yàn),創(chuàng)作出各類 B 端模型。

更多AI落地實(shí)踐:

一、部署 Stable Diffusion 流程

本地安裝 stable Diffusion

本地安裝教程:(https://www.bilibili.com/video/BV1iM4y1y7oA)(來源:B 站秋葉 aaaki)

云端安裝和本地安裝優(yōu)劣勢(shì)對(duì)比

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

二、3Dbanner 模型訓(xùn)練流程

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

1. 收集設(shè)計(jì)素材,準(zhǔn)備訓(xùn)練集

設(shè)計(jì)師在尋找素材盡可能風(fēng)格上統(tǒng)一,圖片本身的質(zhì)量較高(指看得清楚)。圖片的數(shù)量也不是越多越好,數(shù)量大概在 20 張以內(nèi),5 張以上就好。(目前使用的是騰訊云的運(yùn)營活動(dòng) Banner)

2. 圖片的處理和裁切

對(duì)圖片進(jìn)行裁切和處理,盡可能讓素材中的主元素在畫面的中間,圖片的大小處理為方形大小(512*512),處理的原則模型主體清晰。

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

3. 對(duì)圖片進(jìn)行預(yù)處理操作(手動(dòng)為圖片添加描述)

打標(biāo)的處理方法相對(duì)前步驟會(huì)比較麻煩,因?yàn)?B 端 banner 都偏抽象類型,很難用一句話描述清楚,所以這里我們也不能使用 stable diffusion 默認(rèn)的預(yù)處理圖片方式,我們選擇手動(dòng)打標(biāo)的方式。 描述分為兩個(gè)模塊:底座造型的描述和主體造型的描述。

底座的描述:一個(gè)方形白色為主的藍(lán)色點(diǎn)綴底座,圓形的裝飾物,發(fā)光燈條,透明玻璃材質(zhì),藍(lán)色的玻璃質(zhì)感,白色科技感。

主體的描述:白色科技感,幾何圖形,球形,立方體,藍(lán)色玻璃質(zhì)感,藍(lán)色科技感,科技感,立方體發(fā)光,透明玻璃材質(zhì),云 ICON,云 logo

針對(duì)每張圖新建一個(gè) text 文檔添加描述,我們將上述內(nèi)容手動(dòng)改為英文:A white square base with blue accents, circular decoration, glowing light bars, transparent glass material, blue glass texture, white tech feel, geometric shapes, spherical, cubic, blue glass texture, blue tech feel, tech feel, cubic glowing, transparent glass material, cloud icon, cloud logo.

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

4. 使用 Dreambooth 訓(xùn)練

①創(chuàng)建模型

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

在“1“這里輸入你訓(xùn)練出來的模型的名稱,你可以按照你的喜好隨意起一個(gè)英文名,例如:tencentcloud_icon/tencentcloud_banner 之類的,使用 A100GPU 訓(xùn)練一個(gè)模型只需要 5 分鐘,所以可能會(huì)訓(xùn)練多個(gè)模型來做對(duì)比測(cè)試,時(shí)間一長你就不知道這些模型是干啥的了,所以我建議規(guī)范命名,能清楚闡述模型的效果。

“2”這里選擇基底模型,Dreambooth 模型是基于一個(gè)現(xiàn)成的模型生成的,理想情況下,你訓(xùn)練出來的新模型中:你訓(xùn)練的主元素由你訓(xùn)練出來的這部分繪制,其他內(nèi)容由基底模型生成(基底模型決定了整個(gè)新模型的風(fēng)格,如果用的是二次元的模型,最后出來的風(fēng)格也就是二次元的 icon)選擇一個(gè)基礎(chǔ)模型來進(jìn)行訓(xùn)練,我們這次是基于 lyriel_v16.safetensors(這是一款偏寫實(shí)人物的模型,通過 C 站 https://civitai.com/搜索可直接下載 )。

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

“3”點(diǎn)擊“Create”創(chuàng)建模型。

2. 開始訓(xùn)練

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

“1”“2”輸入你的模型的存放目錄和輸出目錄(文件夾命名的方式例如:tencentcloud_in,tencentcloud_out)。

輸入圖片的尺寸(因?yàn)橹耙呀?jīng)把圖片的尺寸調(diào)整為 512x512,那么這個(gè)地方直接輸入就好)。

因?yàn)槲覀円呀?jīng)手動(dòng)為圖片打標(biāo)過了,所以我們需要把 stable diffusion 生成的打標(biāo)內(nèi)容手動(dòng)替換成我們自己的文本內(nèi)容。

3. Dreambooth 設(shè)置

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

  1. 到 dreambooth 選項(xiàng)卡中,選擇剛剛創(chuàng)建的模型:tencent cloud_banner。
  2. Instance prompt:輸入的 tenentcloud(這個(gè)名字不要和現(xiàn)實(shí)中存在的常見詞語沖突)。
  3. Dataset Directory:填寫你輸出的圖片和文本的目錄。
  4. Class Prompt:填寫 icon/或者品類。
  5. Classification Dataset Directory 和 Total Number of Class/Reg Images 的參數(shù)根據(jù)自己的需要來填寫,例如:40。
  6. Learning Rate 和 Training Steps 這兩個(gè)選項(xiàng)都是決定訓(xùn)練強(qiáng)度的,數(shù)字越大,學(xué)習(xí)效果越強(qiáng),學(xué)習(xí)效果越強(qiáng),就越容易過擬合,但是過低又會(huì)欠擬合。
  7. Train Wizard 如果是訓(xùn)練人物模型的可以選擇 lora,不是的話可以不用選擇。
  8. 點(diǎn)擊"Generate Ckpt",大概 4 個(gè)小時(shí)候之后就可以煉丹成功(根據(jù)顯卡配置測(cè)算時(shí)間,2080T 大概時(shí)間 6 小時(shí),3080T 大概時(shí)間 4 小時(shí))。

5.設(shè)計(jì)師生產(chǎn)流程如下:

①文生圖生成方法

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

關(guān)鍵詞寫法:內(nèi)容,風(fēng)格,質(zhì)量,視角四個(gè)方向填寫關(guān)鍵詞。

以“服務(wù)器”為例:

關(guān)鍵詞:A server, a round object with blue center and top white center, top with light blue center and white center, white background, very high quality 3D ICON. The model is divided into two parts, top and bottom. The bottom is a white metal cube with a slightly glassy texture. There are metal screws at all four corners. The screws are very small. There is only one main object in the scene, the object is on the right side of the screen, and the camera is an isometric perspective. X-axis is -20°, y-axis is 45°, z-axis is 0°, masterpiece, best quality, high resolution

負(fù)向描述:nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,fuzzy structure

采樣迭代步數(shù):20-30(不是越高越好,過高也會(huì)出現(xiàn)抽象的內(nèi)容)。

生成數(shù)量:跟隨自己的電腦配置來填寫參數(shù),配置好填寫數(shù)量高,配置低填寫低。

寬度/高度:512*512。

最后的生成效果(我們挑選了一些生成較好的效果)。

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

②混入 Lora“DDicon”生成

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

以“AI 大腦”為例:

關(guān)鍵詞:A brain, a round object with blue center and top white center, top with light blue center and white center, white background, very high quality 3D ICON. The model is divided into two parts, top and bottom. The bottom is a white metal cube with a slightly glassy texture. There are metal screws at all four corners. The screws are very small. There is only one main object in the scene, the object is on the right side of the screen, and the camera is an isometric perspective. X-axis is -20°, y-axis is 45°, z-axis is 0°, masterpiece, best quality, high resolution [lora:DDicon:1]

負(fù)向描述:nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,fuzzy structure

采樣迭代步數(shù):20-30(不是越高越好,過高也會(huì)出現(xiàn)抽象的內(nèi)容)。

生成數(shù)量:跟隨自己的電腦配置來填寫參數(shù),配置好填寫數(shù)量高,配置低填寫低。

寬度/高度:512*512。

生成結(jié)果:

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

當(dāng)我們?cè)陉P(guān)鍵詞中一些“球體”關(guān)鍵詞,也有一些抽象圖形的產(chǎn)生。

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

當(dāng)我們?cè)陉P(guān)鍵詞中一些“愛心”關(guān)鍵詞,也有一些愛心圖形的產(chǎn)生。

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

同樣的方法我們也訓(xùn)練了其他的風(fēng)格效果(目前跟騰訊云簡介頁設(shè)計(jì)風(fēng)格一致)。

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

另外一種風(fēng)格的嘗試。

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

③后期之后放入到運(yùn)營場景使用

使用相同方法,不同尺寸進(jìn)行場景風(fēng)格測(cè)試,通??捎糜趫鼍邦^圖 banner 繪制,做商用的狀態(tài)。

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

結(jié)語

總的來說,AI 技術(shù)的發(fā)展為 B 端設(shè)計(jì)師提供了更多的創(chuàng)作可能性和工具。本文介紹的基于 Stable Diffusion 混合 AI 的 3D Banner 設(shè)計(jì)方法,不僅能夠減少設(shè)計(jì)師的重復(fù)渲染工作,還能夠創(chuàng)造出更加出色的設(shè)計(jì)作品。我們相信,隨著 AI 技術(shù)的不斷發(fā)展,它將會(huì)在 B 端創(chuàng)作中發(fā)揮越來越重要的作用,為設(shè)計(jì)師們帶來更多的創(chuàng)作靈感和更高效的工作方式。這種新思路的出現(xiàn),不僅可以提高設(shè)計(jì)師的工作效率和創(chuàng)作質(zhì)量,也能夠?yàn)槠髽I(yè)帶來更多的商業(yè)價(jià)值。因此,我們期待著更多的 AI 技術(shù)能夠應(yīng)用到 B 端創(chuàng)作中,為這個(gè)行業(yè)帶來更多的創(chuàng)新和突破。

歡迎關(guān)注作者微信公眾號(hào):「騰訊云設(shè)計(jì)中心」

騰訊云AI落地實(shí)戰(zhàn)!如何用 Stable Diffusion 完成B端圖標(biāo)設(shè)計(jì)?

收藏 351
點(diǎn)贊 87

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。