每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

AI 起來以后,很多公司都在尋找 AI 的落地應用場景,都在思考項目工程的流程節(jié)點怎么用 AI 去做提效。隨著人工智能技術的快速發(fā)展,圖像生成需求在許多行業(yè)中迅速增長。目前,許多企業(yè)已經開始廣泛使用 Stable Diffusion(SD)技術進行圖像生成。例如創(chuàng)作 IP 的延展,或應用于廣告、產品設計、游戲開發(fā)等多個領域。然而,面向企業(yè)的大規(guī)模圖像生成需求,批量化是一種剛需。

企業(yè)在使用 SD 進行圖像生成時,往往需要處理大量的圖像素材。這一過程中包括編寫 CSV 需求單、審核素材、打標和命名等步驟,傳統的手工操作流程效率低下且容易出錯。如果通過 AI 節(jié)點式接入和 GPT 技術,可以顯著優(yōu)化這些流程,提高效率和質量。

所以我們需要去搭建一整個 SOP,將批量生圖做成工程化,這樣才能提高效率。批量產圖 SOP 的設計需要明確每一個流程節(jié)點,保證高效、標準化的操作。

一、傳統的 SOP 流程

我們之前傳統的產圖 SOP,需要投入的人力大概在 5 個:

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

  1. 技術開發(fā)同學:負責編寫工程文件,預留 SD 的 API 接口,保證系統能夠靈活調用 SD 進行圖像生成。
  2. 模型煉制設計師:負責煉制 Lora,確保產出的素材符合公司需求的統一風格,能夠滿足不同類型素材的需求,如 3D 風格、插畫風格和真實場景等。
  3. prompt 編寫設計師:編寫 CSV,確定圖像生成的具體需求(即生圖 prompt)。
  4. 素材審核員:在圖像生成完成后,整理和審核輸出的素材。制定素材入庫的視覺標準,區(qū)分素材為三類:一類是達到視覺標準,無需二次調整的素材;一類是有略微瑕疵,二次調整后可達到入庫標準的素材;一類是嚴重異形、畫面雜亂等素材,無修改價值的素材。
  5. 素材管理員:針對素材的業(yè)務、類型、標簽、命名做有效分類,確保素材在平臺上的可查找性和可管理性。

整個 SOP 的運行中最核心的是 prompt 編寫設計師的角色,他需要調控 prompt 和替換 lora,需要去調試工程文件中的節(jié)點。技術開發(fā)同學和模型煉制設計師其實都是前置資源,從產圖到入庫可使用的這個邏輯是這樣的:

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

由 prompt 編寫設計師編寫 csv 條目,一個條目是一個圖像生成的 prompt,所以批量生產同樣的需要批量寫 prompt,prompt 影響最終產圖的質量。例如我們編寫 10 個 prompt,那就可以產出 10 張素材。編寫 100 個,那就可以產出 100 張素材。但人工編寫的過程非常耗時耗力,這個節(jié)點是否可以借助 AI 的能力去提效?又該如何接入 AI?這個可以先思考一下,我們接著鏈路往下看。

當批量產出素材后,例如今天產出 2000 張素材,將素材轉接給素材審核員,按照入庫的視覺標準將素材進行分類和二次調整。2000 張圖需要多久,不包含調整的過程,只去審核區(qū)分素材就需要 1-2 個小時。那 20000 張呢?這個節(jié)點是否有 AI 運作的空間?

當素材處理完,假設良品率為 40%,可直接入庫的素材為 800 張,由素材管理員進行分類和素材信息標注。當然我們也可以只給素材命個名,如:3D 紅包.png 那如果有 200 個不同的紅包素材,素材如何有效召回,所以素材如何有效管理,之前傳統的素材管理,是將命名作分級,如:業(yè)務 A/3D/紅包/裝滿金幣。那僅這個命名過程,假設一張素材命名需要 5s,那 800 張僅命名大約需要 1.11 小時。那這個時間是否可以借助 AI 給吃掉?

二、SOP 流程:AI 節(jié)點提效

ok,我們梳理一下整個產圖到入庫的流程鏈路,其中費時費力的節(jié)點:

  1. prompt 批量編寫
  2. 素材審核
  3. 素材分類及信息標注

這些節(jié)點如何借助 AI 做提效或者直接用 AI 的能力給吃掉。我是借助 GPT 的能力,讓技術同學預留出 GPT 的 API 接口,我負責煉制 GPTs,將調試好的 prompt 發(fā)給前端,在工程文件中調用。在多個節(jié)點安插 GPT:

輸入想要的素材關鍵詞及數量--批量產出 prompt 條目(GPT 助力)--導入 csv 需求單--運行程序--調用 SD 做批量產圖--素材質量篩選,將素材分類(GPT 助力)--素材信息標注(GPT 助力)

所以除了前置資源,前端提供的工程文件和模型煉制設計師提供的 lora,剩余的事情只需要一名設計師即可,不僅減少人力成本,而且效率還比之前高數倍甚至數十倍。

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

GPT 助力,都煉制了哪些 GPTs?我們逐一分析一下相關的 prompt 該如何寫:

1. 批量 csv 條目助手

通過簡單的關鍵詞描述, 批量產出 csv,不過這里要注意一點,我們需要制定 prompt 規(guī)則:

prompt 指令規(guī)則:*圖像名稱(內容),*圖像具體關鍵詞,不希望圖像里有什么

打開[新建文件夾」找到“csv”右鍵打開操作目錄,選擇“打開于-Finder”選中文件夾中的“csv”,右鍵打開方式選擇-“文稿編輯”填入 csv 條目

① Prompt

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

② 輸出效果

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

輸出的所有 csv 條目,并非可以一次成功,產出素材的內容差異性和風格統一性還是需要人工把控,畢竟只有你才知道你真正想要什么,你想要一個有卡通翅膀的紅包,這種裝飾性詞匯具備不可控且不可猜性,所以人工針對 csv 條目做二次調整。

2. 素材審核員

用 AI 代替人工做素材質量的判斷和分類,做初級篩選,人工做素材質量的二次審核,確保最終素材均達到入庫標準。

批量產出的素材分為三個檔:S 級、A 級、B 級。

S 級:完全達到入庫視覺標準;A 級:基本達到入庫視覺標準,單一或部分元素輕微瑕疵;B 級:不符合入庫視覺標準,畫面雜亂、元素變形、穿模等嚴重瑕疵。

① Prompt

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

大家可以試一下,將 GPT 的 API 接入工程文件中,批量生產的素材輸出在「新建文件夾」中,調用 API 讀取圖片,將每個圖片文件傳輸后做質量審核和分類。API 返回的數據包含會 label 字段,用于分類。根據返回的分類標簽,將圖片移動到對應的分類文件夾中。

處理返回數據并自動分類移動圖片的 Python 代碼示例:

import os
import openai
import shutil

# 設置OpenAI API密鑰
openai.api_key = 'your_openai_api_key'

# 批量圖片文件夾路徑
input_folder = 'Batch_Image'
output_folder = 'Processed_Images'

# 創(chuàng)建輸出文件夾(如果不存在)
if not os.path.exists(output_folder):
os.makedirs(output_folder)

# 函數:調用OpenAI API進行圖片質量審核和分類
def analyze_image(file_path):
with open(file_path, 'rb') as image_file:
image_data = image_file.read()

response = openai.Image.create(
file=image_data,
n=1,
size="1024x1024",
prompt="Classify and review the quality of this image."
)

return response

# 遍歷Batch_Image文件夾中的所有圖片文件
for filename in os.listdir(input_folder):
if filename.endswith('.jpg') or filename.endswith('.png'):
file_path = os.path.join(input_folder, filename)

# 調用OpenAI API
response = analyze_image(file_path)

# 假設API返回的數據如下
result = response['data'][0]
classification = result['label']

# 打印結果(可選)
print(f"Image: {filename}, Classification: {classification}")

# 根據分類結果將圖片移動到不同的文件夾中
classification_folder = os.path.join(output_folder, classification)
if not os.path.exists(classification_folder):
os.makedirs(classification_folder)
shutil.move(file_path, os.path.join(classification_folder, filename))

print("Processing completed.")

3. 素材信息標注員

素材的管理以業(yè)務、素材類型做分類;以標簽、命名做標注。所以也需要一些前置信息的準備。業(yè)務和素材類型的全量信息,標簽庫的搭建和標簽填充,命名的規(guī)則和限制。

其中標簽,我以類別維度去搭建的標簽格式:

一、主要類別(1)子分類 [具體標簽]

大概整理了 17 個主要類別,基本囊括 80%的圖片素材類別,后期也會定期維護更新。

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

標簽體系搭建后,對素材進行了全面的命名規(guī)范:

業(yè)務(判斷)-素材類型(判斷)-標簽一、標簽二、標簽三-人物描述/物體名稱(判斷,不超過 4 個字)-動作/場景/特征(判斷,不超過 6 個字)。

素材的名稱即為:人物描述/物體名稱(判斷,不超過 4 個字)-動作/場景/特征(判斷,不超過 6 個字)。例:一張女足的素材。全命名為“業(yè)務-3D-青年、運動健身、運動員-女孩-踢球”。

① Prompt

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

② 輸出效果

每小時1200張素材圖!保姆級教程幫你搭建批量生圖的SOP工程

完成這一切的部署,就可以批量生圖,素材審核,針對素材信息進行自動填充,素材批量上傳入庫。

關于 Prompt 如何編寫,感興趣的同學可以看之后的文章。此篇文章意在分享目前大廠內部針對 AI 是如何運作,如何借助 AI 的能力做節(jié)點式提效。

由于該 SOP 并不是一個產品化的流程,所以需要設計師掌握一定的代碼能力:

部署 Python 集成開發(fā)環(huán)境(IDE):為 Python 開發(fā)提供了一個強大的工具集,如 Spyder、Jupyter Notebook、PyCharm 等 Python 開發(fā)工具都可以。

目前的批量生成素材的質量還是不錯的,不過良品率還是有點低,在 15%左右,不過純批量生產可以達到 1200 張/小時,可直接入庫的素材至少有 144 張。若不調試 csv 持續(xù)輸出,每天達到入庫視覺標準的素材有 1152 張。當然這是理想的數據。目前有著隱性和顯性兩個方面的元素影響,例如一:網速、調用 SD 批量生圖時長和讀取圖片的返回數據時長這些隱形因素。二:人工二次審核和 csv 條目的調試這些顯性因素。

通過接入 GPT,減少了人工操作的時間,使得整體流程更加高效。prompt 批量生成、素材篩選、標簽生成和命名等環(huán)節(jié)均實現了自動化,大幅提升了工作效率。利用 GPT 的智能篩選與標記功能,可以確保素材質量的一致性和可靠性,減少了人工操作可能導致的錯誤。自動化的生成與篩選流程大大減輕了人工操作的負擔,使得成本降低的同時效率提升。

再接再厲,共同探索 AI 的更多可能性~

收藏 37
點贊 57

復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網立場,未經允許不得轉載。