大家好,我是和你們聊設(shè)計(jì)的花生~
有關(guān)注「神器挖掘機(jī)」阿文(微博 @Simon_阿文 )的朋友,可能已經(jīng)了解到他最近正在瘋狂安利一款 AI 繪畫神器——Disco Diffusion。
這款被阿文稱作“用嘴就能畫畫”的神器,能通過輸入的一段描述語句,自動(dòng)渲染生成對應(yīng)場景的圖片。渲染結(jié)果質(zhì)量非常高,高到不說是 AI 自動(dòng)生成的話,你肯定會(huì)覺得是哪位繪畫大神的作品。
更多在線神器戳 ?? http://76r.com.cn/category/tools-download
先來看看阿文第一次嘗試的結(jié)果,輸入關(guān)鍵詞是“星空下的向日葵花?!?,渲染時(shí)間很久,但是出來的效果也足以令人驚嘆。(圖片來源: @Simon_阿文 )
之后阿文又嘗試了中國畫的水墨風(fēng)格,Disco Diffusion 的表現(xiàn)仍然很好。
圖片來源: @Simon_阿文 ,關(guān)鍵詞 ”a beautiful painting of Chinese Shanshui landscape, clouds, ink style, trending on artstation“
在看到阿文的推薦后,微博上很多網(wǎng)友也開始嘗試,并同樣取得了不錯(cuò)的渲染結(jié)果。
圖片來源:微博 @MIGRAINER- ,關(guān)鍵詞 ”Among planets, stars and galaxies, an armada of gigantic very long spaceships travels at light speed, detailed,artstation,Chris Foss“
怎么樣,是不是有點(diǎn)顛覆你對 AI 繪畫的認(rèn)知了?
Disco Diffusion 自發(fā)布后,在外網(wǎng)引起了很多藝術(shù)家的關(guān)注。他們也使用 Disco Diffusion 進(jìn)行各種嘗試,也誕生了很多優(yōu)質(zhì)的渲染作品。
圖片來源: @cosmicWranglerZ ,關(guān)鍵詞 ”A BOY TRAVELING WITH HIS CYBERNETIC PACKHORSE SELLING TECHNO ALCHEMY WARES“ 渲染結(jié)果,
圖片來源: @x1ao4 ,關(guān)鍵詞 ”ancient Chinese village“
可以看出 Disco Diffusion 自動(dòng)渲染出的圖片無論是色彩還是氛圍都達(dá)到非常高的水平,充滿魔幻色彩。作為一個(gè) AI 程序,這一切是如何實(shí)現(xiàn)的呢?
Disco Diffusion 是在今年 2 月初開始流行的一個(gè) AI 圖像生成程序,它可以根據(jù)描述場景的關(guān)鍵詞渲染出對應(yīng)的圖像,開發(fā)者是藝術(shù)家兼程序開發(fā)員 @Somnai_dreams 。
這款程序的特點(diǎn)在于:它直接托管在谷歌的 Colaboratory 上的,即整個(gè)程序是直接在瀏覽器中編寫和運(yùn)行代碼的。這也意味著使用 Disco Diffusion 對電腦配置沒有要求,因?yàn)槌绦虿恍枰徊渴鸬奖镜亍?/p>
Github 地址 ?? https://github.com/alembics/disco-diffusion
Disco Diffusio 程序的首頁
Disco Diffusion 程序的首頁不是我們熟悉的用戶界面,而是一行行看起來很復(fù)雜代碼——有點(diǎn)像沒有外殼的機(jī)器,將線路零件直接呈現(xiàn)在用戶面前了。
這些代碼就是 Disco Diffusion 整個(gè)程序運(yùn)行下來的所需的全部代碼,而且都已經(jīng)按步驟分類好了??雌饋砗苌?yuàn)W,但真正需要我們動(dòng)手修改參數(shù)的地方極少,跟隨網(wǎng)站上的教學(xué)視頻你可以很快就弄懂如何操作。
需要用戶修改參數(shù)的其中一部分,右邊的界面還是簡單易懂的
Disco Diffusion 之所以有如此強(qiáng)大圖像生成功能,倚仗的是背后強(qiáng)大的機(jī)器學(xué)習(xí)模型。
這個(gè)模型并不是簡單地將一堆圖片生硬拼接,而是在基于關(guān)鍵詞的基礎(chǔ)上,AI 模型對圖像進(jìn)行一次次迭代渲染,直至機(jī)器判定渲染結(jié)果與給定的關(guān)鍵詞匹配度最高,渲染結(jié)果才會(huì)最終確定。
圖片來源: 《How does CLIP Text-to-image generation work?》
這也是為什么我們用 Disco Diffusion 渲染圖像時(shí),畫面最開始都是模糊的噪點(diǎn),而渲染時(shí)間越長,圖片精度就越高。
Disco Diffusion 的圖片生成功能如此強(qiáng)大,那生成圖片的功能可以直接免費(fèi)商用嗎?
首先,Disco Diffusion 程序基于 MIT 開源協(xié)議,即這個(gè)程序供所有互聯(lián)網(wǎng)用戶免費(fèi)使用,還可以復(fù)制、修改甚至出售。用 Disco Diffusion 渲染生成的圖像,版權(quán)歸圖片創(chuàng)作者本人所有。
Disco Diffusion 首頁的「License」中表明程序基于遵循 MIT 開源協(xié)議
那生成的圖片可以直接拿來商用嗎?這個(gè)問題需要謹(jǐn)慎對待。
Disco Diffusion 如同一位具有極強(qiáng)模仿并融合畫風(fēng)能力的畫手,人工需要很長時(shí)間很多精力才能完成的畫作,它通過模型學(xué)習(xí)加機(jī)器渲染,就能用比人工少很多的時(shí)間實(shí)現(xiàn)。
使用 Disco Diffusion 渲染的節(jié)氣圖,作者: 弈湘君
但 Disco Diffusion 本質(zhì)上只是通過算法不斷去接近給出的關(guān)鍵詞,或者是在幾個(gè)關(guān)鍵詞中取得一個(gè)平衡點(diǎn),以達(dá)到文本規(guī)定下最大程度的“相似”。
這些行為都是“模仿”——無論好壞,只要相似度夠高就行了,遠(yuǎn)達(dá)不到人腦可以有意識(shí)進(jìn)行取舍的程度。
使用莫比斯風(fēng)格渲染出的圖,風(fēng)格與原作者非常接近。(圖片來源: @Simon_阿文 )
如果你在給 Disco Diffusion 的關(guān)鍵詞中,涉及到風(fēng)格特別鮮明的藝術(shù)家或者商業(yè)作品,那么渲染生成的圖像會(huì)呈現(xiàn)出非常相似的風(fēng)格,這樣自然就會(huì)涉及到侵權(quán)的問題了。
阿文對 Disco Diffusion 圖片是否可以商用的看法,圖片來源 @Simon_阿文
Disco Diffusion 可以輕易渲染出猶如專業(yè)藝術(shù)家創(chuàng)作的圖畫,是否意味著能夠取代人工創(chuàng)作呢?我們看看專業(yè)藝術(shù)家是怎么看待這個(gè)問題的。
Stijn Windig 是一位來自荷蘭的藝術(shù)家,擅長概念設(shè)計(jì),作品細(xì)節(jié)精致,場景恢弘。
Stijn Windig 的部分作品(圖片來源: Artstation )
Disco Diffusion 開始流行后,Stijn Windig 也開始嘗試將 Disco Diffusion 運(yùn)用到自己的創(chuàng)作過程中。
Stijn Windig 先用 Disco Diffusion 渲染生成各種圖像,然后將圖像導(dǎo)入 PS 放大,以此為基礎(chǔ)在上面進(jìn)行進(jìn)一步的繪制。下面是他以這種方式創(chuàng)作的作品:
Stijn Windig 在進(jìn)行一系列的嘗試之后,將作品分享到 Artstation 上并寫到:
……完善每幅渲染圖像大約需要 1.5 小時(shí)。從Disco Diffusion中獲取圖像花費(fèi)了更長的時(shí)間,嘗試了不同的文本提示,直到我得到了一些看起來還比較像樣的東西。
Stijn Windig 還將自己的創(chuàng)作經(jīng)驗(yàn)寫成文章發(fā)布到自己的 Artstation 博客中,在文章中,Stijn Windig 說到:
……首先,這東西(Disco Diffusion)的存在是有點(diǎn)瘋狂的……它似乎能夠輕易地生成史詩般恢弘的概念藝術(shù)。
……當(dāng)你下載圖片后將其放大,并開始在上面作畫,就會(huì)有一種超級(jí)失望的感覺,因?yàn)槭聦?shí)證明,盡管從遠(yuǎn)處看它是一個(gè)恢弘場景的圖像,但實(shí)際上那里什么也沒有。
……一旦你開始想細(xì)化圖像中某個(gè)不明確的部分,渲染圖像就失去了其原有的氛圍感了……在試圖 "完善細(xì)化 "圖像的過程中,我發(fā)現(xiàn)每一筆都不對勁,因?yàn)槲铱梢钥吹綀D像變得更加明確,但卻失去了原有的魅力。
……當(dāng)我第一次發(fā)現(xiàn)它時(shí),我試著把它用在一個(gè)客戶的項(xiàng)目上,這個(gè)項(xiàng)目的特點(diǎn)是環(huán)境中有很多建筑元素,我想,"Disco Diffusion能夠幫助我快速完成這幅畫",但是結(jié)果并非如此。我發(fā)現(xiàn)渲染圖像上的每一處都需要重新繪制,甚至每一個(gè)像素都得重新刻畫。因?yàn)楸M管它可能看起來像一個(gè)有城市的山地景觀,但實(shí)際上沒有正確的房屋、山垛、植被和其他東西,只有模糊的概括暗示。我在一幅本應(yīng)一兩天內(nèi)就完成的圖像上耗費(fèi)了一個(gè)星期。如果是直接創(chuàng)作三維甚至是二維的圖像,我就會(huì)更快……
所以這就是 Disco Diffusion 的弱點(diǎn):如果你想要一些有具體細(xì)節(jié)的事物,Disco Diffusion 是沒有能力來生成一個(gè)細(xì)節(jié)精細(xì)的作品的(至少目前是沒有)。它不擅長刻畫具體細(xì)節(jié)。
除此之外,它不擅長人物、動(dòng)物、汽車、透視,或任何需要真正具體特征的東西……
從文章中,我們可以看出,身為專業(yè)藝術(shù)家的 Stijn Windig 在經(jīng)過多次實(shí)踐后,認(rèn)為 Disco Diffusion 并沒有取代人工創(chuàng)作的能力,原因有以下幾點(diǎn):
- 從 Disco Diffusion 中獲取想要圖像并不容易,需要花費(fèi)大量時(shí)間去調(diào)試關(guān)鍵詞。
- Disco Diffusion 沒有刻畫具體細(xì)節(jié)的能力,渲染出的圖像乍看驚艷,如果仔細(xì)觀察就會(huì)發(fā)現(xiàn)大部分都是模糊的概括暗示,不能達(dá)到商業(yè)水平的要求。
- 如果想在渲染圖像的基礎(chǔ)上刻畫細(xì)節(jié),就相當(dāng)于要把整個(gè)圖重新畫一遍,這樣一個(gè)流程下來花耗費(fèi)的時(shí)間精力,比直接手繪還要多。
不過 Stijn Windig 還是對 Disco Diffusion 的未來發(fā)展持樂觀態(tài)度,雖然直接利用 Disco Diffusion 渲染的圖像進(jìn)行商業(yè)創(chuàng)作的嘗試失敗了,但將它作為一種靈感參考生成器還是非常好的。
……我發(fā)現(xiàn)它更適合作為一個(gè)創(chuàng)意生成器使用。給它一個(gè)提示,比如"晴天的幻想城市,王座游戲,巨大的城堡",它將返回一些至少能激發(fā)想象力的東西,并可以用來在上面繪畫,作為草圖。
根據(jù)文本提示渲染出高質(zhì)量圖像的技術(shù)近年來發(fā)展迅速,除了我們今天談到的 Disco Diffusion,類似的程序還有 Nightcafe Creator 和 Dream by wobom。
1. 人工智能藝術(shù)生成器 NightCafe Creator
「網(wǎng)站」 https://creator.nightcafe.studio/
NightCafe Creator 是一款人工智能藝術(shù)生成器應(yīng)用程序,可以根據(jù)你給出文本提示生成多種風(fēng)格的藝術(shù)作品。創(chuàng)作完成后版權(quán)歸創(chuàng)作者所有,并可以隨心所欲地使用它們。
NightCafe Creator 還支持將照片轉(zhuǎn)換成各種風(fēng)格的圖片,使用這個(gè)功能要注意照片的版權(quán)問題。
2. 人工智能藝術(shù)生成器 Dream by Wobom
「網(wǎng)址」 https://www.wombo.art/
Dream 是一款 ISO 應(yīng)用程序,輸入一個(gè)文本提示,選擇一種藝術(shù)風(fēng)格,就能在幾秒鐘內(nèi)生成一副精美的圖畫。
3. 欣賞更多用 Disco Diffusion 渲染出高質(zhì)量的作品:
「國內(nèi)」 點(diǎn)擊此處直達(dá)
「國外」 點(diǎn)擊此處直達(dá)
「參考資料」
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
熱評(píng) 369