AI 起來以后,很多公司都在尋找 AI 的落地應用場景,都在思考項目工程的流程節(jié)點怎么用 AI 去做提效。隨著人工智能技術的快速發(fā)展,圖像生成需求在許多行業(yè)中迅速增長。目前,許多企業(yè)已經開始廣泛使用 Stable Diffusion(SD)技術進行圖像生成。例如創(chuàng)作 IP 的延展,或應用于廣告、產品設計、游戲開發(fā)等多個領域。然而,面向企業(yè)的大規(guī)模圖像生成需求,批量化是一種剛需。
企業(yè)在使用 SD 進行圖像生成時,往往需要處理大量的圖像素材。這一過程中包括編寫 CSV 需求單、審核素材、打標和命名等步驟,傳統的手工操作流程效率低下且容易出錯。如果通過 AI 節(jié)點式接入和 GPT 技術,可以顯著優(yōu)化這些流程,提高效率和質量。
所以我們需要去搭建一整個 SOP,將批量生圖做成工程化,這樣才能提高效率。批量產圖 SOP 的設計需要明確每一個流程節(jié)點,保證高效、標準化的操作。
我們之前傳統的產圖 SOP,需要投入的人力大概在 5 個:
- 技術開發(fā)同學:負責編寫工程文件,預留 SD 的 API 接口,保證系統能夠靈活調用 SD 進行圖像生成。
- 模型煉制設計師:負責煉制 Lora,確保產出的素材符合公司需求的統一風格,能夠滿足不同類型素材的需求,如 3D 風格、插畫風格和真實場景等。
- prompt 編寫設計師:編寫 CSV,確定圖像生成的具體需求(即生圖 prompt)。
- 素材審核員:在圖像生成完成后,整理和審核輸出的素材。制定素材入庫的視覺標準,區(qū)分素材為三類:一類是達到視覺標準,無需二次調整的素材;一類是有略微瑕疵,二次調整后可達到入庫標準的素材;一類是嚴重異形、畫面雜亂等素材,無修改價值的素材。
- 素材管理員:針對素材的業(yè)務、類型、標簽、命名做有效分類,確保素材在平臺上的可查找性和可管理性。
整個 SOP 的運行中最核心的是 prompt 編寫設計師的角色,他需要調控 prompt 和替換 lora,需要去調試工程文件中的節(jié)點。技術開發(fā)同學和模型煉制設計師其實都是前置資源,從產圖到入庫可使用的這個邏輯是這樣的:
由 prompt 編寫設計師編寫 csv 條目,一個條目是一個圖像生成的 prompt,所以批量生產同樣的需要批量寫 prompt,prompt 影響最終產圖的質量。例如我們編寫 10 個 prompt,那就可以產出 10 張素材。編寫 100 個,那就可以產出 100 張素材。但人工編寫的過程非常耗時耗力,這個節(jié)點是否可以借助 AI 的能力去提效?又該如何接入 AI?這個可以先思考一下,我們接著鏈路往下看。
當批量產出素材后,例如今天產出 2000 張素材,將素材轉接給素材審核員,按照入庫的視覺標準將素材進行分類和二次調整。2000 張圖需要多久,不包含調整的過程,只去審核區(qū)分素材就需要 1-2 個小時。那 20000 張呢?這個節(jié)點是否有 AI 運作的空間?
當素材處理完,假設良品率為 40%,可直接入庫的素材為 800 張,由素材管理員進行分類和素材信息標注。當然我們也可以只給素材命個名,如:3D 紅包.png 那如果有 200 個不同的紅包素材,素材如何有效召回,所以素材如何有效管理,之前傳統的素材管理,是將命名作分級,如:業(yè)務 A/3D/紅包/裝滿金幣。那僅這個命名過程,假設一張素材命名需要 5s,那 800 張僅命名大約需要 1.11 小時。那這個時間是否可以借助 AI 給吃掉?
ok,我們梳理一下整個產圖到入庫的流程鏈路,其中費時費力的節(jié)點:
- prompt 批量編寫
- 素材審核
- 素材分類及信息標注
這些節(jié)點如何借助 AI 做提效或者直接用 AI 的能力給吃掉。我是借助 GPT 的能力,讓技術同學預留出 GPT 的 API 接口,我負責煉制 GPTs,將調試好的 prompt 發(fā)給前端,在工程文件中調用。在多個節(jié)點安插 GPT:
輸入想要的素材關鍵詞及數量--批量產出 prompt 條目(GPT 助力)--導入 csv 需求單--運行程序--調用 SD 做批量產圖--素材質量篩選,將素材分類(GPT 助力)--素材信息標注(GPT 助力)
所以除了前置資源,前端提供的工程文件和模型煉制設計師提供的 lora,剩余的事情只需要一名設計師即可,不僅減少人力成本,而且效率還比之前高數倍甚至數十倍。
GPT 助力,都煉制了哪些 GPTs?我們逐一分析一下相關的 prompt 該如何寫:
1. 批量 csv 條目助手
通過簡單的關鍵詞描述, 批量產出 csv,不過這里要注意一點,我們需要制定 prompt 規(guī)則:
prompt 指令規(guī)則:*圖像名稱(內容),*圖像具體關鍵詞,不希望圖像里有什么
打開[新建文件夾」找到“csv”右鍵打開操作目錄,選擇“打開于-Finder”選中文件夾中的“csv”,右鍵打開方式選擇-“文稿編輯”填入 csv 條目
① Prompt
② 輸出效果
輸出的所有 csv 條目,并非可以一次成功,產出素材的內容差異性和風格統一性還是需要人工把控,畢竟只有你才知道你真正想要什么,你想要一個有卡通翅膀的紅包,這種裝飾性詞匯具備不可控且不可猜性,所以人工針對 csv 條目做二次調整。
2. 素材審核員
用 AI 代替人工做素材質量的判斷和分類,做初級篩選,人工做素材質量的二次審核,確保最終素材均達到入庫標準。
批量產出的素材分為三個檔:S 級、A 級、B 級。
S 級:完全達到入庫視覺標準;A 級:基本達到入庫視覺標準,單一或部分元素輕微瑕疵;B 級:不符合入庫視覺標準,畫面雜亂、元素變形、穿模等嚴重瑕疵。
① Prompt
大家可以試一下,將 GPT 的 API 接入工程文件中,批量生產的素材輸出在「新建文件夾」中,調用 API 讀取圖片,將每個圖片文件傳輸后做質量審核和分類。API 返回的數據包含會 label 字段,用于分類。根據返回的分類標簽,將圖片移動到對應的分類文件夾中。
處理返回數據并自動分類移動圖片的 Python 代碼示例:
import os import openai import shutil # 設置OpenAI API密鑰 openai.api_key = 'your_openai_api_key' # 批量圖片文件夾路徑 input_folder = 'Batch_Image' output_folder = 'Processed_Images' # 創(chuàng)建輸出文件夾(如果不存在) if not os.path.exists(output_folder): os.makedirs(output_folder) # 函數:調用OpenAI API進行圖片質量審核和分類 def analyze_image(file_path): with open(file_path, 'rb') as image_file: image_data = image_file.read() response = openai.Image.create( file=image_data, n=1, size="1024x1024", prompt="Classify and review the quality of this image." ) return response # 遍歷Batch_Image文件夾中的所有圖片文件 for filename in os.listdir(input_folder): if filename.endswith('.jpg') or filename.endswith('.png'): file_path = os.path.join(input_folder, filename) # 調用OpenAI API response = analyze_image(file_path) # 假設API返回的數據如下 result = response['data'][0] classification = result['label'] # 打印結果(可選) print(f"Image: {filename}, Classification: {classification}") # 根據分類結果將圖片移動到不同的文件夾中 classification_folder = os.path.join(output_folder, classification) if not os.path.exists(classification_folder): os.makedirs(classification_folder) shutil.move(file_path, os.path.join(classification_folder, filename)) print("Processing completed.")
3. 素材信息標注員
素材的管理以業(yè)務、素材類型做分類;以標簽、命名做標注。所以也需要一些前置信息的準備。業(yè)務和素材類型的全量信息,標簽庫的搭建和標簽填充,命名的規(guī)則和限制。
其中標簽,我以類別維度去搭建的標簽格式:
一、主要類別(1)子分類 [具體標簽]
大概整理了 17 個主要類別,基本囊括 80%的圖片素材類別,后期也會定期維護更新。
標簽體系搭建后,對素材進行了全面的命名規(guī)范:
業(yè)務(判斷)-素材類型(判斷)-標簽一、標簽二、標簽三-人物描述/物體名稱(判斷,不超過 4 個字)-動作/場景/特征(判斷,不超過 6 個字)。
素材的名稱即為:人物描述/物體名稱(判斷,不超過 4 個字)-動作/場景/特征(判斷,不超過 6 個字)。例:一張女足的素材。全命名為“業(yè)務-3D-青年、運動健身、運動員-女孩-踢球”。
① Prompt
② 輸出效果
完成這一切的部署,就可以批量生圖,素材審核,針對素材信息進行自動填充,素材批量上傳入庫。
關于 Prompt 如何編寫,感興趣的同學可以看之后的文章。此篇文章意在分享目前大廠內部針對 AI 是如何運作,如何借助 AI 的能力做節(jié)點式提效。
由于該 SOP 并不是一個產品化的流程,所以需要設計師掌握一定的代碼能力:
部署 Python 集成開發(fā)環(huán)境(IDE):為 Python 開發(fā)提供了一個強大的工具集,如 Spyder、Jupyter Notebook、PyCharm 等 Python 開發(fā)工具都可以。
目前的批量生成素材的質量還是不錯的,不過良品率還是有點低,在 15%左右,不過純批量生產可以達到 1200 張/小時,可直接入庫的素材至少有 144 張。若不調試 csv 持續(xù)輸出,每天達到入庫視覺標準的素材有 1152 張。當然這是理想的數據。目前有著隱性和顯性兩個方面的元素影響,例如一:網速、調用 SD 批量生圖時長和讀取圖片的返回數據時長這些隱形因素。二:人工二次審核和 csv 條目的調試這些顯性因素。
通過接入 GPT,減少了人工操作的時間,使得整體流程更加高效。prompt 批量生成、素材篩選、標簽生成和命名等環(huán)節(jié)均實現了自動化,大幅提升了工作效率。利用 GPT 的智能篩選與標記功能,可以確保素材質量的一致性和可靠性,減少了人工操作可能導致的錯誤。自動化的生成與篩選流程大大減輕了人工操作的負擔,使得成本降低的同時效率提升。
再接再厲,共同探索 AI 的更多可能性~
復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網立場,未經允許不得轉載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
品牌形象設計標準教程
已累計誕生 726 位幸運星
發(fā)表評論 為下方 7 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓