研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

上篇反響不錯,加快了我速更的意志,繼續(xù)輸出。

根據(jù)上篇講了基礎(chǔ)部分(增加元素細(xì)節(jié)),以及怎么去給提示,那么下篇要講的還是脫離不了基礎(chǔ)部分和提示,只是增加了人物連續(xù)性的復(fù)雜場景以及表情原理。

還是需要感謝這位偉大的作者:@AshutoshShrivastava,結(jié)尾附上該作者鏈接。

人物連續(xù)性場景變化

1. 前期提示準(zhǔn)備

在我們開始制作圖像之前,有一些重要的考慮因素:

注意:我們將遵循類似的提示格式,但在這種情況下,我們?yōu)榛咎崾驹O(shè)置了巨大的差異。

Prompt:

[Base Prompt] + [additional details / variationinformation]+identifer-1

提示:

[基本提示] +[額外細(xì)節(jié)/變量信息]+identifer -1

Chat GPT 敘述的場景以 室內(nèi)/室外活動 命令(這很重要,所以不要忽視它。了解它為什么以這種方式構(gòu)建)。

您可以向 Chat GPT 提供這個簡潔的提示,指示它遵循這種格式,但使用新的基本命令。由于我們正在使用相同的聊天實例,所以無需輸入整個命令。

<---提示開始--->

Now, we're going to work on the activity scene.

We will set the base prompt as: 'Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun.'

Is that okay? In this case, you will have the freedom to update clothes and other details under the 'additional elements' section.

Are you ready now?

現(xiàn)在,我們將處理活動場景。

我們將把基本提示設(shè)置為:

“畫一位名叫 Hope 的 30 歲美國女子,她留著卷曲的發(fā)型盤在發(fā)髻上?!?/p>

這個方式可以嗎?在這種情況下,您將可以在“額外元素”部分自由更新服裝和其他細(xì)節(jié)。
您準(zhǔn)備好了嗎?

<--- 提示結(jié)束 --->

ChatGPT 的回應(yīng):

<--回應(yīng)開始--->

是的,這聽起來是一個很好的方法。將基本提示設(shè)置為:

“畫一位名叫 Hope 的 30 歲美國女子,她留著卷曲的發(fā)型盤在發(fā)髻上。”

可以讓您在不改變主要角色特征的情況下根據(jù)活動或場景調(diào)整服裝和其他元素。我將確保只根據(jù)您指定的活動在“額外細(xì)節(jié)/變量信息”類別內(nèi)進(jìn)行修改。

感謝澄清,我已經(jīng)準(zhǔn)備好按照這種方式繼續(xù)。請?zhí)峁┫乱粋€您希望 Hope 參與的活動或場景。

<---回應(yīng)結(jié)束--->

注意:這一調(diào)整是因為霍普穿著一件綠色 T 恤,我們不希望她到處都穿同樣的衣服。這還演示了如何在不影響角色一致性的情況下輕微修改基本提示。

這次,我們是已經(jīng)確定的基本提示,而不是圖像。由于基本提示已設(shè)置并且 Chat GPT 已準(zhǔn)備好,因此我們可以開始發(fā)布命令以構(gòu)建我們的圖像。

與上篇不同,我們不會使用(現(xiàn)在或制作)命令。相反,我們將簡單地請求一個活動,然后 DALL-E 3 將創(chuàng)建圖像。讓我們看看它是如何工作的。

2. 例子演示

①如果我希望 Hope 去遠(yuǎn)足 (My command: Hope doing hiking ).

顏色提示:[基本提示] [額外細(xì)節(jié)/變量信息] +identifer -1

這張圖片的 DALL-E 提示將是:

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, hiking in the mountains with appropriate attire and gear -0010

“畫一位名叫 Hope 的 30 歲美國女子,她留著卷曲的發(fā)型盤在發(fā)髻上,穿著合適的裝備 在山上遠(yuǎn)足。” -0010

觀察:您可以看到它更新了一些細(xì)節(jié),如山脈和合適的服裝,這些是由 ChatGPT 提供的。

注意:術(shù)語“合適的裝備”被用作概括性描述詞,以使 DALL·E 3 生成的圖像符合所提到活動常見著裝。這為圖像生成過程提供了一些靈活性。

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

②如果我們想要確定 Hope 穿著的夾克顏色怎么辦?我們當(dāng)然可以指定這一點,但最好不要提供太多信息,讓 DALL-E 3 處理細(xì)節(jié)。

這張圖片的 DALL-E 提示將是:

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a white jacket and carrying a red backpack, hiking in the mountains -0011

“畫一位名叫 Hope 的 30 歲美國女子,她留著卷曲的發(fā)型盤在發(fā)髻上,穿著白色夾克,背著紅色背包,在山上遠(yuǎn)足。” -0011

觀察:您可以看到它更新了一些細(xì)節(jié),加入了白色夾克和背著紅色背包。

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

③假設(shè)現(xiàn)在我們希望 Hope 在冬季的環(huán)境中制作雪人:

這張圖片的 DALL-E 提示將是:

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, dressed in winter attire, in a snowy landscape making a snowman -0012

“畫一位名叫 Hope 的 30 歲美國女子,她留著卷曲的發(fā)型盤在發(fā)髻上,穿著冬季服裝,在多雪的風(fēng)景中制作雪人。” -0012

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

④如果要在活動中添加一些文本,我們看看它是如何工作的:

這張圖片的 DALL-E 提示將是:

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, seated comfortably in a library setting, wearing a black t-shirt with the word 'HOPE' written on it, engrossed in reading a book -0013

“畫一位名叫 Hope 的 30 歲美國女子,她留著卷曲的發(fā)型盤在發(fā)髻上,坐在一個舒適的圖書館環(huán)境中,穿著一件上面印有“HOPE”字樣的黑色 T 恤,專心閱讀一本書?!?-0013

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

3. 表情原理

在使用類似照片的真實圖片時,捕捉情感是很簡單的,但在使用插圖類型的主題時,要保持情感和一致性要困難得多。

當(dāng)主題是插圖時,為什么很難保持某些情感的一致性?

①考慮像悲傷、憤怒、快樂、驚訝、懷疑、好奇和焦慮等情感。這些描述詞富有表現(xiàn)力。當(dāng)渲染成插圖時,特別是如果被壓縮成一個單詞,DALL-E 傾向于放大這些表情。這可能導(dǎo)致更加卡通或風(fēng)格化的外觀。

Prompt: Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, {emotion} -1

提示:畫一位名叫 Hope 的 30 歲美國女子,她的卷曲波浪發(fā)型盤成發(fā)髻,穿著綠色 T 恤,{情感} -1

情感值可以是:憤怒,快樂,悲傷,驚訝(Angry,Happy,Sad,Surprised)等。

看看這些圖片,您會注意到它們都具有卡通(夸裝)的特點。

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

②對于照片風(fēng)格的真實圖片,這不是問題。讓我們來看下面的結(jié)果。

添加一個單詞的描述詞,比如悲傷、憤怒、快樂或驚訝,不會破壞一致性。

Prompt: Photoreaslitic portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, {emotion} -1

提示:30 歲的美國女性 Hope 的真實照片風(fēng)格肖像,她的卷曲波浪發(fā)型盤成發(fā)髻,穿著綠色 T 恤,{情感} -1

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

③對于夢幻、若有所思、好奇、自信和寬慰等情感,添加一個單詞的描述詞不會帶來問題。因為這些情感沒有那么生動和富有表現(xiàn)力。因此,DALL-E 不會夸張這些表情,角色也不會顯得卡通般。

Prompt:Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, {emotion} -1

提示:30 歲的美國女性 Hope 的插畫風(fēng)格肖像,她的卷曲波浪發(fā)型盤成發(fā)髻,穿著綠色 T 恤,{情感} -1

情感值可以是:夢幻、若有所思、好奇、自信和寬慰(dreamy, pensive, intrigued, confident, and relieved)。

查看這些圖像,您會發(fā)現(xiàn)一致性在整個過程中得以保持。

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

④為了解決這個問題,我們需要巧妙地強調(diào)情感。最佳平衡的方法是使用“帶有微妙但明顯的{情感名稱}表情”這種表述,找到這個完美的措辭是具有挑戰(zhàn)性的。嘗試了大約 20 種組合,只有這一種被證明是有效的。

Prompt: Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, with a nuanced yet evident {emotion} expression -1

提示:30 歲的美國女性 Hope 的插畫風(fēng)格肖像,她的卷曲波浪發(fā)型盤成發(fā)髻,穿著綠色 T 恤,帶有微妙但明顯的{情感}表情 -1

情感值可以是:生氣、快樂、悲傷、驚訝(Angry,Happy,Sad,Surprised)。

檢查這些圖像,您會發(fā)現(xiàn)情感存在,但角色的一致性仍然保持完好

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

參考地址: https://twitter.com/ai_for_success/status/1716792768352440725

歡迎關(guān)注作者微信公眾號:「RaDesign」

研究上百個小時,高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(中)

收藏 39
點贊 39

復(fù)制本文鏈接 文章為作者獨立觀點不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。