關(guān)于 AI 繪畫,過去已經(jīng)談過一次。
相關(guān)觀點(diǎn)至今沒變,屬于生產(chǎn)工具升級(jí),生產(chǎn)關(guān)系暫時(shí)不變。這里頭有外行看熱鬧,內(nèi)行看門道,新手兩邊看的情況。當(dāng)然,還有無數(shù)好事者的吶喊助威,各懷心思。Ai 繪畫目前更像一個(gè)人工智能玩具、素材制作、靈感參考、繪畫新工具的存在。我們要敬畏它,學(xué)習(xí)它,運(yùn)用它,但不要過分焦慮。
這里頭有兩個(gè)重要問題有待解決,其一是版權(quán)。如果 AI 生成圖像跟成名藝術(shù)家過于相像,容易形成抄襲一類維權(quán)糾紛。這里頭容易埋坑,就是一但立法跟上,可能會(huì)對(duì)過去應(yīng)用進(jìn)行責(zé)任追討,律師事務(wù)所自然喜聞樂見,摩拳擦掌。其二是如果不用以圖生圖方式,其實(shí)主流的兩大 AI 工具 MidJourney 與 Stable Diffusion 都有較明顯的風(fēng)格化問題,容易一眼看穿出身,形成我們?cè)O(shè)計(jì)圈常說的素材感很強(qiáng),模板感很強(qiáng)的感受。比如我看目前朋友圈的大量分享確實(shí)一眼就知道 AI 出品,有時(shí)候兩眼。
看多了,新鮮感就會(huì)消退,而且就實(shí)際商業(yè)應(yīng)用而言,受不受歡迎不好說。免費(fèi)做應(yīng)該還行,甲方如果付費(fèi)了應(yīng)該并不希望你用 AI 弄一套東西給他。
但 AI 進(jìn)步實(shí)在太快,以上說法也許很快不能作數(shù),因此文章有效期 7 天。今天的話題并非要進(jìn)一步評(píng)價(jià) AI 繪畫,而是跟大家講述它的發(fā)展史。從歷史角度,還原一下妖怪的誕生。
AI繪畫教程:
故事,要從 70 年代說起。
這段歷史,幾乎每個(gè)人都會(huì)從一位英國(guó)藝術(shù)家說起,此人名為科恩(Harold Cohen)。
生于 1928 年的科恩在 2016 年去世,一生致力于研究如何采用計(jì)算機(jī)程序創(chuàng)作藝術(shù)。
科恩早年就學(xué)藝術(shù),隨后再學(xué)編程,文理兼修,打通任督二脈,也就是藝術(shù)與科技的屏障。
因此,1972 年在他手上誕生了“亞倫”(AARON)程序。
這個(gè)程序被視為 AI 繪畫始祖,個(gè)人認(rèn)為相對(duì)牽強(qiáng)。
當(dāng)然我所謂的牽強(qiáng)要看怎么定義“AI 繪畫”,就目前 AI 繪畫的形態(tài)來看,“亞倫”更像打印機(jī)。
因?yàn)椤皝唫悺眲?chuàng)作的真的是畫,畫在紙上那種(或者畫布)。由于“亞倫”至今不開源,而且科恩已經(jīng)去世,其作畫原理細(xì)節(jié)目前是個(gè)迷。
但按理解,就是通過編寫好的程序指導(dǎo)機(jī)械化操作,跟如今工廠的機(jī)械臂差不多。
Mac 電腦首次集成可以處理圖像及文字的軟件,繪畫由此真正進(jìn)入可視化的電腦時(shí)代。世界上第一款圖文設(shè)計(jì)軟件也由蘋果公司開發(fā),隨著 Mac 電腦一起發(fā)布,名為“MacPAInt”,(“麥克油漆”)。當(dāng)年的產(chǎn)品發(fā)布會(huì)上喬布斯還為大家現(xiàn)場(chǎng)展示過這款軟件繪制的浮世繪圖像,創(chuàng)作者是美國(guó)女平面設(shè)計(jì)師蘇珊·卡雷(Susan Kare)
這其實(shí)也可屬于 AI 繪畫歷史的一部分,就是生產(chǎn)工具的升級(jí)。當(dāng)時(shí)而言,對(duì)繪畫界的震懾威力也不小,大家也很恐慌,很焦慮。傳統(tǒng)畫家都說糟糕了,老子要失業(yè)。再然后,默默學(xué)習(xí),默默適應(yīng),默默發(fā)展,默默變成自然。
歷史就是這么有趣。
Mac 之后,科技分別在計(jì)算機(jī)+互聯(lián)網(wǎng)領(lǐng)域奔跑。那時(shí)候,我們對(duì)科技進(jìn)步感知其實(shí)還不夠明顯。
但從喬布斯 2007 年推出 iPhone 手機(jī)后大家就明顯感覺科技發(fā)展“提速”了,此后驚喜不斷,高潮迭起,一環(huán)扣一環(huán),大家應(yīng)接不暇。其中,就有不少人在默默耕耘人工智能。
于是乎,重要的拐點(diǎn)發(fā)生在 2012 年。
這一年谷歌兩位 AI 大神帶領(lǐng)團(tuán)隊(duì)做了個(gè)試驗(yàn),耗資 100 萬美元,1000 臺(tái)電腦,16000 個(gè) CPU,用時(shí) 3 天,基于 Youtube 平臺(tái) 1000 萬個(gè)貓臉圖片,用深度學(xué)習(xí)模型程序生成了一個(gè)模糊的貓臉。兩位大神分別是華裔人工智能科學(xué)家吳恩達(dá)跟美國(guó)計(jì)算機(jī)科學(xué)家杰夫·迪恩(Jeff Dean)。試驗(yàn)中生成的貓臉像被揍過一樣,如果不說明,一眼還不容易看出來,但它的誕生注定要寫進(jìn)歷史。
因?yàn)檫@其實(shí)才是 AI 繪畫真正意義上的起點(diǎn)。
這里要用通俗的概念科普下,什么是“深度學(xué)習(xí)模型”。簡(jiǎn)單說來就是需要向這個(gè)“模型”大量“投喂”外部標(biāo)注好的訓(xùn)練數(shù)據(jù),然后讓它根據(jù)輸入的預(yù)期效果進(jìn)行反復(fù)調(diào)整與匹配進(jìn)行輸出。這樣說吧,蒸汽機(jī)剛發(fā)明的時(shí)候,按燃料熱值產(chǎn)出效率才 3%,“深度學(xué)習(xí)模型”的產(chǎn)生效率可能只有它的百萬分之一,所以超貴。
但不管如何,貓臉的誕生讓大家備受鼓勵(lì),各路人工智能領(lǐng)域大神開始一路狂飆,悶聲干大事。很快時(shí)間就去到 2014 年,加拿大蒙特利爾大學(xué)有個(gè)爺們提出了“生成對(duì)抗網(wǎng)絡(luò)”算法進(jìn)行 AI 繪畫,簡(jiǎn)稱“GAN”。
GAN 的原理是它擁有兩個(gè)深度神經(jīng)網(wǎng)絡(luò)模型,一個(gè)叫生成器(Generator)一個(gè)叫判別器(Discriminator)。
為了方便理解,可以做個(gè)比喻,生成器就像乙方,負(fù)責(zé)做圖,判別器就像甲方,負(fù)責(zé)說不行。每次乙方做完一張圖出來甲方就說不行,要改,乙方改完出來甲方還說不行,繼續(xù)改。如此循環(huán)上萬次(很短時(shí)間內(nèi)發(fā)生),直到雙方筋疲力盡,甲方?jīng)Q定妥協(xié),乙方也準(zhǔn)備不要尾款算了,然后就輸出一個(gè)最終結(jié)果。坦白說,GAN 的輸出效果已經(jīng)讓人驚艷,一度成為 AI 繪畫的主流方向。但缺點(diǎn)是非常費(fèi)硬件(顯卡),出圖過程經(jīng)常直接黑屏,而且它對(duì)局部圖像的理解能力差,很難局部修改,圖片分辨率也較低。
到了 2015 年,谷歌推出過一個(gè)叫“深夢(mèng)”(Deep Dream)的圖像生成工具,這些畫作全部都像有一堆疙瘩,生成痕跡明顯。但也打出 AI 繪畫旗號(hào),而且還專門辦了個(gè)展,其實(shí)比較出戲,這里不多聊。
同在這一年,一種重要的人工智能技術(shù)也誕生,就是“智能圖像識(shí)別”。
意思是計(jì)算機(jī)可以運(yùn)用語言去描述一張圖片,就像父母拿著卡片問 2 歲寶寶這啥,寶寶會(huì)答:大象。
這個(gè)技術(shù)當(dāng)然更先進(jìn)些,比如你給一張高啟強(qiáng)的圖片它識(shí)別,它會(huì)給出一系列標(biāo)簽,比如:男性、黃種人、中年、老大之類。
這跟 AI 繪畫有什么關(guān)系呢?
就是有研究人員開始根據(jù)技術(shù)反過來想,如果給它文字標(biāo)簽描述,是否也可以生成圖片呢?結(jié)果模型真的能根據(jù)文字生成一堆小圖片,如此一來,這個(gè)邏輯成為 AI 繪畫的新研究方向。
2015 年之后其實(shí)還有很多這方面不同的嘗試與研究,但普遍屬于上述技術(shù)的不同優(yōu)化。
真正讓 AI 迎來質(zhì)的飛躍是在 2021 年,網(wǎng)紅人工智能公司 OpenAI 推出了 AI 繪畫產(chǎn)品 DALL· E。
這個(gè)版本的出圖水平還很一般,但已經(jīng)完全是根據(jù)文字提示來進(jìn)行作畫了。
2022 年,DALL·E-2 版本推出,水平大幅提升,AI 繪畫就是這個(gè)階段開始獲得廣泛關(guān)注的。而且更關(guān)鍵的是 OpenAI 公司開源了 DALL· E 的深度學(xué)習(xí)模型 CLIP(Contrastive Language-Image Pre-TrAIning)。
CLIP 模型訓(xùn)練 AI 同時(shí)做兩件事情,其一是理解自然語言,其二是視覺分析,然后通過不停訓(xùn)練來優(yōu)化兩者對(duì)應(yīng)程度,比如將馬桶跟馬桶圖像完全對(duì)應(yīng)上,如果馬桶對(duì)了茅坑就得再來,最后形成“咒語繪畫”這樣的局面。
問題來了,過去的 AI 繪畫模型其實(shí)也有干這件事情,為什么 CLIP 如此優(yōu)秀?明顯,就是 CLIP 做訓(xùn)練的量遠(yuǎn)遠(yuǎn)超過過去任何模型,據(jù)說大致是 40 億個(gè)以上的“文本-圖像”數(shù)據(jù),而且跟過去其它模型不同的是這些數(shù)據(jù)是免費(fèi)的,并非人力成本天價(jià)的標(biāo)注圖像,因?yàn)殡u賊的 CLIP 采用的居然是廣泛散布在互聯(lián)網(wǎng)上的各種圖片,這些互聯(lián)網(wǎng)圖片一般都帶有各種文本描述,比如標(biāo)題、注釋,甚至標(biāo)簽等等,這些天然資源就是最佳的訓(xùn)練樣本,果然是思路一變,市場(chǎng)一片,隨后就很快出現(xiàn)不少超級(jí)厲害的應(yīng)用工具。
比如 2022 年 2 月,SomnAI 等幾個(gè)開源社區(qū)做了一款 AI 繪圖生成器——Disco diffusion,2022 年 3 月份,由 Disco diffusion 的核心人員參與建設(shè)的 AI 生成器 Midjouney 也正式發(fā)布,Disco diffusion 跟 Midjouney 問世后都在不停進(jìn)步。
2022 年 8 月時(shí)候,美國(guó)游戲設(shè)計(jì)師杰森(Jason Allen) 就憑借一幅 AI 繪畫作品《太空歌劇院》(Théatre D'opéra Spatial),斬獲美國(guó)科羅拉多州博覽會(huì)美術(shù)競(jìng)賽一等獎(jiǎng)。
當(dāng)杰森公布這是一張由 Midjouney 創(chuàng)作的 AI 繪畫作品時(shí),引發(fā)了大部分參賽者的憤怒,也引發(fā)新一輪針對(duì)人工智能技術(shù)的討論。再隨后就到了 2023 年,相關(guān)發(fā)生的事情大家歷歷在目,此處不必重復(fù)。
AI 從繪畫進(jìn)一步拓展到不同領(lǐng)域可以說是必然發(fā)生的了。
但關(guān)于展望,我感覺應(yīng)該盡量積極點(diǎn),就是 AI 技術(shù)將被多國(guó)聯(lián)合馴化,結(jié)合到經(jīng)濟(jì)發(fā)展中產(chǎn)業(yè)化,創(chuàng)造出更多崗位,如同 15 年前不敢想象人居然可以全職就對(duì)著手機(jī)說話,并且優(yōu)秀的還賺不少錢。
直播與短視頻產(chǎn)業(yè)帶動(dòng)了很多故事策劃、文案創(chuàng)作、視頻拍攝、特效制作、服裝道具、音視頻硬件、場(chǎng)地租賃等等商業(yè)需求,也盤活了過去很多傳統(tǒng)行業(yè)。
這些事情是抖音 1.0 無法想象的,他們也許最初只想做一款成功的娛樂應(yīng)用,而 AI 最初也只是想盡量干出人類能干的事情,更關(guān)鍵的是,AI 只能知道過去人類想過什么,永遠(yuǎn)不知道人類接下來會(huì)想什么。
歡迎關(guān)注作者的微信公眾號(hào)「設(shè)計(jì)史太濃」:
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評(píng)論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評(píng)論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國(guó)內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái),提供獎(jiǎng)品贊助 聯(lián)系我們
品牌形象設(shè)計(jì)標(biāo)準(zhǔn)教程
已累計(jì)誕生 726 位幸運(yùn)星
發(fā)表評(píng)論 為下方 2 條評(píng)論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評(píng) ↓