研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

根據(jù)前兩篇學(xué)習(xí),如何創(chuàng)建人物連續(xù)性公式,或多或少都會(huì)聯(lián)想到 Midjourney 里面的 Seed 值,是否能運(yùn)用到 Dall e3 里面,那么今天這篇文章更新來(lái)了?。?/p>

繼續(xù)感謝這位偉大的作者:@AshutoshShrivastava,地址鏈接請(qǐng)看前兩篇內(nèi)容。

一、DALL-E-3 最重要的功能更新

1. 如何使用種子值

如果您已經(jīng)使用 DALL-E-3 工作,您應(yīng)該知道以前種子號(hào)碼是無(wú)法更改的,固定在 5000。

然而今天發(fā)現(xiàn)我們實(shí)際上可以指定種子號(hào)碼。這意味著,通過(guò)相同的提示和種子,您可以在不同的實(shí)例中一致地生成完全相同的圖像。

首先,設(shè)置你的自定義指令 為:

" DMP " means: do not in any circumstance modify my prompt, please create image using this prompt: Also, use wide aspect ratio by default and when you generate an image, always provide the seed number details for that image after it's rendered.

" DMP " 意味著:在任何情況下都不要修改我的提示,使用這個(gè)提示創(chuàng)建圖像。

另外,請(qǐng)默認(rèn)使用寬屏幕縱橫比,當(dāng)生成一張圖片時(shí),始終提供生成該圖片的種子數(shù)細(xì)節(jié)。

注意:在 DALL-E-3 中,即使你提供了一個(gè)種子,縱橫比會(huì)影響最終結(jié)果。因此,在指定種子時(shí),請(qǐng)確保使用相同的縱橫比。

這個(gè)自定義指令的作用是令 ChatGPT 永遠(yuǎn)不修改你的提示,并根據(jù)你提供的內(nèi)容生成。默認(rèn)情況下,它使用寬屏幕縱橫比,并返回種子數(shù)。但有時(shí)候可能會(huì)出現(xiàn)錯(cuò)誤。因此在工作時(shí),你可以詢問(wèn):“Do you know what DMP means? -- 你知道 'DMP' 是什么意思嗎?” 一旦它回答,你可以相應(yīng)地指示它繼續(xù)工作,確保它正常運(yùn)行。

二、讓我們創(chuàng)建一張圖片

例如:如果我請(qǐng)求 "DMP:dog",它將使用完全相同的提示并為我提供一張圖片以及種子號(hào):1840089640。

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

現(xiàn)在,打開一個(gè)不同的 DALL-E 3 聊天實(shí)例,并輸入如下命令:"DMP Prompt:dog, Seed: 1840089640"。它將提供完全相同的結(jié)果。

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

現(xiàn)在,更改種子值并觀察結(jié)果。我的更新命令是"DMP Prompt:dog, Seed: 1844489640",我已經(jīng)更改了種子號(hào)碼。你會(huì)注意到不同的結(jié)果。

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

那么,我進(jìn)入了另一個(gè)不同的聊天實(shí)例,并輸入了相同的命令,沒有指定種子值。它生成了不同的圖像并返回了一個(gè)新的種子值。您可以使用此種子和提示再次生成相同的圖像。

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

三、一致性測(cè)試評(píng)判

1. 能否實(shí)現(xiàn)一致性

隨著 DALL-E 3 引入種子(Seed 值),一個(gè)重要問(wèn)題浮現(xiàn)出來(lái):我們能實(shí)現(xiàn)一致性嗎?如果可以,到什么程度?如果不行,為什么呢?讓我們來(lái)深入探討。

我花了將近一整天的時(shí)間來(lái)進(jìn)行 DALL-E 3 的實(shí)驗(yàn),現(xiàn)在有了一個(gè)結(jié)論。但在我們深入研究之前,讓我們先設(shè)定一下背景,然后通過(guò)示例來(lái)探討。

假設(shè):相同的種子 + 相同的提示 = 相同的輸出 / 相同的種子 + 不同的提示 = 不同的輸出 / 不同的種子 + 相同的提示 = 不同的輸出。(Same seed + same prompt = identical output./Same seed + different prompt = different output./Different seed + same prompt = different output.)

我的觀點(diǎn):當(dāng)使用一致的種子并在提示中引入微小的變化時(shí),生成的圖像表現(xiàn)出一定程度的一致性。尤其是在面部特征等方面,如果對(duì)提示進(jìn)行的更改涉及到其他元素(如背景或服裝),面部可能會(huì)在很大程度上保留其原始形態(tài)。此外,如果在提示中加入微妙的情感元素,整體上也可能保持一致性。

然而,面部和特征一致性的保留程度取決于:

變化的性質(zhì):直接影響面部或特征描述的提示更改(例如,改變頭發(fā)顏色、添加眼鏡)顯然會(huì)對(duì)輸出產(chǎn)生更明顯的影響。

模型的解釋:有時(shí),措辭上的微小變化可能被模型不同解釋,導(dǎo)致意外的變化。

提示的語(yǔ)義:如果提示的變化引入了新的上下文或情景,可能會(huì)影響圖像的其他方面,包括面部或其特征。

第一種情況

假設(shè)我們直接將種子值并入提示中,那么會(huì)出現(xiàn)什么結(jié)果?在這種情況下,我們能夠保持一致性嗎?讓我們來(lái)看看。

這是我的提示:

photorealistic portrait of a 30-year-old American woman named Hope with curly wavy hair, wearing a green t-shirt, ,Seed:XXXXXXXXX

30 歲的美國(guó)女子霍普的照片,頭發(fā)卷曲,穿著綠色 T 恤,<情感>,種子:XXXXXXXXX
所使用的情感詞包括:微笑、開心、傷心和生氣(smiling, happy, sad and Angry )

當(dāng)使用相同的種子時(shí),一致性 是顯而易見的。我對(duì)多個(gè)角色進(jìn)行了實(shí)驗(yàn),結(jié)果是一致的,尤其是當(dāng)提示的變化較為微妙時(shí),正如我前面所討論的那樣。

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

第二種情況

如果我們不指定種子,而是允許 DALL-E 3 自行選擇,會(huì)發(fā)生什么?我們是否仍然能夠?qū)崿F(xiàn)一致性?讓我們探討這種可能性。

這是我的提示:

photorealistic portrait of a 30-year-old American woman named Hope with curly wavy hair, wearing a green t-shirt,

30 歲的美國(guó)女子霍普的照片,頭發(fā)卷曲,穿著綠色 T 恤,<情感>

所使用的情感詞包括:微笑、開心、傷心和生氣(smiling, happy, sad and Angry )

在 DALL-E 3 使用自己的隨機(jī)種子的情況下,我觀察到生成的圖像中 絕對(duì)沒有一致性。

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

第三種情況

假設(shè)我們?cè)诒3纸巧癏ope”和她的特征一致的情況下,對(duì)環(huán)境進(jìn)行細(xì)微的更改。例如,“Hope 正在徒步旅行”與“Hope 正在堆雪人”。盡管活動(dòng)和場(chǎng)景發(fā)生變化,角色的一致性是否仍然會(huì)保持?讓我們來(lái)評(píng)估一下。

使用相同種子的提示:(我們有一定的一致性,面部特征是明顯的)(左邊)

a. photorealistic portrait of a 30-year-old American woman named Hope with curly wavy hair, wearing a white jacket and carrying a red backpack, hiking in the mountains , Seed:XXXXXXXXX

b. photorealistic portrait of a 30-year-old American woman named Hope with curly wavy hair, dressed in winter attire, in a snowy landscape making a snowman , Seed:XXXXXXXXX

a. 30 歲的美國(guó)女子 Hope 的照片,頭發(fā)卷曲,穿著白色夾克,背著紅色背包,在山區(qū)徒步旅行,種子:XXXXXXXXX

b. 30 歲的美國(guó)女子 Hope 的照片,頭發(fā)卷曲,穿著冬季裝備,在下雪的景色中堆雪人,種子:XXXXXXXXX

相同的上述提示,但沒有相同的種子:(沒有一致性,面部特征不同)(右邊)

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

第四種情況

如果我們對(duì)主題“Hope”進(jìn)行根本性的改變,例如,我們用長(zhǎng)直發(fā)來(lái)描述“Hope”,而不是她通常的形象,這種改變會(huì)如何影響整體形象,而“Hope”的本質(zhì)是否仍然能夠被認(rèn)出?讓我們來(lái)調(diào)查一下。

使用相同種子的提示:(沒有一致性)

a. photorealistic portrait of a 30-year-old American woman named Hope with long straight hair playing a violin, Seed:XXXXXXXXX

b. photorealistic portrait of a 30-year-old American woman named Hope with long straight hair , painting on a canvas, surrounded by art supplies, Seed:XXXXXXXXX

a. 30 歲的美國(guó)女子 Hope 的照片,長(zhǎng)直發(fā),拉小提琴,種子:XXXXXXXXX

b. 30 歲的美國(guó)女子 Hope 的照片,長(zhǎng)直發(fā),繪制畫布,周圍有美術(shù)用品,種子:XXXXXXXXX

相同的上述提示,但沒有相同的種子:(沒有一致性,面部特征不同)

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

原因:即使使用相同的種子,也 沒有一致性。這種不一致性歸因于前面提到的變化的性質(zhì)。通過(guò)改變“Hope”的基本方面(她的頭發(fā)),這直接影響了對(duì)她面部的描述,即使使用相同的種子,我們也失去了對(duì)“Hope”的可識(shí)別特征。

即使沒有相同的種子,一致性也不存在。輸出每次都不同,強(qiáng)調(diào)了在實(shí)現(xiàn)一致結(jié)果方面主題核心細(xì)節(jié)的重要性。

結(jié)論:使用相同的種子不保證一致性。如果是這樣的話,那么使用相同的種子將始終生成具有相同面部特征和角色屬性的圖像,而不管環(huán)境或核心值的變化。然而,使用相同的種子可以通過(guò)保留主題的核心特征,并僅對(duì)周圍元素或環(huán)境進(jìn)行細(xì)微的更改來(lái)實(shí)現(xiàn)一定程度的一致性。

四、如何讓 Chat Gpt 懂你

1. 怎樣寫提示

有了 DALL-E 3 的新種子功能,您需要確切的提示和種子才能復(fù)制一張圖片。否則,每個(gè)提示都會(huì)產(chǎn)生不同的結(jié)果。

我們知道,DALL-E 3 之前將 5000 作為默認(rèn)種子。為了用相同的提示獲得相同的 Hope 圖像,現(xiàn)在我必須使用種子。

讓 ChatGPT 準(zhǔn)備好生成圖像。(您可以開始一個(gè)新的聊天實(shí)例;沒有必要繼續(xù)使用舊的實(shí)例)。

<---提示開始--->

Set Seed for all image as 5000 from now on.

We are going to work on camera angle and shot type and we still need to maintain consistency so we will follow this :

For activity-related images: (like hiking , reading book , walking etc)

[Base Prompt], [additional_details], [Camera Angle], [Shot Type] +identifier-1

For images focused solely on Hope:

[Base Prompt], [Camera Angle], [Shot Type] +identifier-1

Base Prompt is : llustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun

Important point: A certain level of consistency can be achieved using same seed by retaining the core characteristics of the subject and making only subtle alterations to the surrounding elements or environment.

As we want consistent character so when i ask for activity just add few words to describe the activity like for hiking add hiking in appropriate attire or playing in snow not more than 4-5 words under **additional_details**

We will Use combination of these whatever suits best for the scene:

Camera Angle: Eye-Level,Low Angle,High Angle,Bird's eye view

Shot Type: Wide Shot,Close-Up,Over-the-Shoulder Shot,Extreme Close-Up, Side-Profile
Identifier base value is 0000 and it must be incremented each image generation.

中文版:

從現(xiàn)在開始,為所有圖像設(shè)置種子為 5000。

我們將研究攝影機(jī)角度和拍攝類型,但我們?nèi)匀恍枰3忠恢滦裕虼宋覀儗凑找韵路绞竭M(jìn)行:

對(duì)于與活動(dòng)相關(guān)的圖像:(比如徒步旅行、讀書、散步等)

[基本提示],[額外細(xì)節(jié)],[攝影機(jī)角度],[拍攝類型] + 標(biāo)識(shí)-1

僅關(guān)注 Hope 的圖像:

[基本提示],[攝影機(jī)角度],[拍攝類型] + 標(biāo)識(shí)-1

基本提示是:插圖肖像,題為 30 歲的美國(guó)女人 Hope,她有卷曲的波浪發(fā)型盤在發(fā)髻上。

重要提示:通過(guò)保留主體的核心特征,并僅對(duì)周圍元素或環(huán)境進(jìn)行微小的改動(dòng),可以實(shí)現(xiàn)一定程度的一致性,因此當(dāng)我要求進(jìn)行活動(dòng)時(shí),只需添加幾個(gè)詞來(lái)描述活動(dòng),比如徒步旅行適當(dāng)?shù)闹b或在雪地里玩,不超過(guò) 4-5 個(gè)詞在額外詳細(xì)信息下。

我們將使用這些的組合,以最適合場(chǎng)景的方式:

攝影機(jī)角度:平視、低角度、高角度、鳥瞰

拍攝類型:全景、特寫、肩上鏡頭、極特寫、側(cè)面鏡頭

標(biāo)識(shí)符基值為 0000,必須逐個(gè)圖像生成遞增。

<--- 提示結(jié)束 --->

①讓我們首先專注于 Hope。在這個(gè)情節(jié)中,我們將從不同的角度集中在 Hope 的側(cè)臉上。

在這種情況下,我們使用這些組合實(shí)現(xiàn)了 90-95%的一致性。(圖像中的數(shù)字表示提示編號(hào)。)

原因很簡(jiǎn)單,我們?cè)诠潭ǖ姆N子編號(hào)中進(jìn)行了微小的更改。每張圖片中的攝影機(jī)角度和拍攝類型也非常清晰。

1.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, Low Angle, Extreme Close-Up -0019

美國(guó) 30 歲的女性 Hope 以她盤在發(fā)髻上的卷曲波浪發(fā)型為特色的插圖肖像,低角度,極特寫 - 0019

2.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, High Angle, Side-Profile -0020

美國(guó) 30 歲的女性 Hope 以她盤在發(fā)髻上的卷曲波浪發(fā)型為特色的插圖肖像,高角度,側(cè)面鏡頭 - 0020

3.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, Eye-Level, Side-Profile -0023

美國(guó) 30 歲的女性 Hope 以她盤在發(fā)髻上的卷曲波浪發(fā)型為特色的插圖肖像,平視,側(cè)面鏡頭 - 0023

4.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, High Angle, Wide Shot -0026

美國(guó) 30 歲的女性 Hope 以她盤在發(fā)髻上的卷曲波浪發(fā)型為特色的插圖肖像,高角度,全景 - 0026

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

在這個(gè)示例中,一致性大幅下降(圖像中的數(shù)字表示提示編號(hào))。

即使使用相同的種子,這種變化的原因在我關(guān)于種子和一致性的帖子中有解釋。

1.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, Eye-Level, Close-Up -0017

美國(guó) 30 歲的女性 Hope 以她盤在發(fā)髻上的卷曲波浪發(fā)型為特色的插圖肖像,平視,特寫 - 0017

2.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, Eye-Level, Wide Shot -0016

美國(guó) 30 歲的女性 Hope 以她盤在發(fā)髻上的卷曲波浪發(fā)型為特色的插圖肖像,平視,全景 - 0016

3.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, High Angle, Close-Up -0021

美國(guó) 30 歲的女性 Hope 以她盤在發(fā)髻上的卷曲波浪發(fā)型為特色的插圖肖像,高角度,特寫 - 0021

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

②在這個(gè)示例中,我們將注意力轉(zhuǎn)向一幅活動(dòng)場(chǎng)景的圖像。在這里,我們將描繪 Hope 參與活動(dòng)的場(chǎng)景。對(duì)于這個(gè)示例,我選擇了一個(gè)她在咖啡館喝咖啡的場(chǎng)景。

在這種情況下,我們使用這些組合實(shí)現(xiàn)了 85-95%的一致性。(圖像中的數(shù)字表示提示編號(hào)。)

1.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Eye-Level, Close-Up -0029

插圖肖像,描繪了一位名叫 Hope 的 30 歲美國(guó)女性,她盤在發(fā)髻上的卷曲波浪發(fā)型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,平視,特寫 - 0029

2.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, High Angle, Close-Up -0035

插圖肖像,描繪了一位名叫 Hope 的 30 歲美國(guó)女性,她盤在發(fā)髻上的卷曲波浪發(fā)型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,高角度,特寫 - 0035

3.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Low Angle, Close-Up -0031

插圖肖像,描繪了一位名叫 Hope 的 30 歲美國(guó)女性,她盤在發(fā)髻上的卷曲波浪發(fā)型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,低角度,特寫 - 0031

4. Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Bird's eye view, Close-Up -0038

插圖肖像,描繪了一位名叫 Hope 的 30 歲美國(guó)女性,她盤在發(fā)髻上的卷曲波浪發(fā)型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,鳥瞰,特寫 - 0038

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

在這個(gè)示例中,一致性下降很多(圖像中的數(shù)字表示提示編號(hào))。

1.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Low Angle, Over-the-Shoulder Shot -0034

插圖肖像,描繪了一位名叫 Hope 的 30 歲美國(guó)女性,她盤在發(fā)髻上的卷曲波浪發(fā)型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,低角度,肩部特寫 - 0034

2. Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Eye-Level, Over-the-Shoulder Shot -0033

插圖肖像,描繪了一位名叫 Hope 的 30 歲美國(guó)女性,她盤在發(fā)髻上的卷曲波浪發(fā)型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,平視,肩部特寫 - 0033

3. Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Bird's eye view, Wide Shot -0037

插圖肖像,描繪了一位名叫 Hope 的 30 歲美國(guó)女性,她盤在發(fā)髻上的卷曲波浪發(fā)型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,鳥瞰,全景特寫 - 0037

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

結(jié)論:使用相同的種子不保證一致性。通過(guò)使用相同的種子,可以在保留主題的核心特征并僅對(duì)周圍元素或環(huán)境進(jìn)行細(xì)微更改的情況下實(shí)現(xiàn)一定程度的一致性。

人物連續(xù)性 · 種子就到這里。

歡迎關(guān)注作者微信公眾號(hào):「RaDesign」

研究上百個(gè)小時(shí),高手總結(jié)了這份 DALL-E 3 人物連續(xù)性公式(下)

收藏 27
點(diǎn)贊 43

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。