熟悉 Midjourney、Stable Difusion 等 AI 繪畫工具的朋友可能遇到這樣一個(gè)問題:在圖像中生成或嵌入精確的文本可能會(huì)比較困難。
現(xiàn)在不必太擔(dān)心了,阿里巴巴集團(tuán)的研究人員已經(jīng)開源了一款名為 AnyText 的多語言視覺文字生成與編輯模型。
AnyText在生成文字方面的控制能力可以媲美專業(yè)的PS,用戶可以自定義文字出現(xiàn)的位置,以及圖片的強(qiáng)度、力度、種子數(shù)等參數(shù)。
目前,它在Github上已經(jīng)獲得了超過2,400顆星的好評(píng)。并且 AnyText 可以作為插件無縫集成到其他開源擴(kuò)散模型中,從而全面增強(qiáng)了圖像嵌入精準(zhǔn)文本的能力。