2025年4月份的AI重大資訊,看這篇就夠了!
ChatGPT 推出基于 GPT-4o 的原生圖像生成功能,升級后功能更加精確,能更好地遵循指示、渲染文字,并支持多輪迭代優(yōu)化圖像。該升級解決了 AI 圖像生成器理解提示詞能力差的問題,并增強(qiáng)了圖像編輯功能。新功能適用于商業(yè)應(yīng)用,如卡片自定義生成和游戲角色設(shè)計(jì)等。目前,該功能已向所有用戶推出,未來幾周內(nèi)開發(fā)者可通過 API 調(diào)用。
Runway 公司發(fā)布了最新 AI 視頻生成模型 Gen-4,該模型能高度保持角色、地點(diǎn)和物體的一致性,生成連貫世界環(huán)境的視頻,無需模型微調(diào)或額外訓(xùn)練。Gen-4 通過學(xué)習(xí)海量視頻數(shù)據(jù)生成新合成視頻,表現(xiàn)出卓越的運(yùn)動(dòng)效果和對現(xiàn)實(shí)世界規(guī)律的理解。Runway 期望通過 Gen-4 等新產(chǎn)品實(shí)現(xiàn)年化收入目標(biāo),同時(shí) AI 視頻生成工具正對電影電視行業(yè)帶來顛覆性挑戰(zhàn)。
Midjourney 公司旗下 AI 圖片生成模型 V7 版本開啟了 alpha 測試,主要升級了“草圖模式”。該模式耗時(shí)和資源消耗減半,同時(shí)提供對話式交互界面,支持實(shí)時(shí)編輯和語音識別生成功能,用戶可通過語音指令調(diào)整圖片。此外 V7 版本增強(qiáng)了文本理解能力和細(xì)節(jié)紋理質(zhì)感,默認(rèn)啟用個(gè)性化模型功能。不過“草圖模式”下生成的圖片分辨率較低,部分功能仍調(diào)用 V6 模型,未來將逐步升級。
騰訊 ARC 實(shí)驗(yàn)室與香港城市大學(xué)聯(lián)合發(fā)布了名為“AnimeGamer”的創(chuàng)新項(xiàng)目,該項(xiàng)目利用多模態(tài)大語言模型實(shí)現(xiàn)無限動(dòng)漫人生模擬,用戶可通過自然語言指令與動(dòng)漫世界實(shí)時(shí)互動(dòng),扮演角色并體驗(yàn)不同動(dòng)漫作品的角色聯(lián)動(dòng)。AnimeGamer 展現(xiàn)了多模態(tài)大語言模型在創(chuàng)意內(nèi)容生成方面的巨大潛力,為動(dòng)漫文化愛好者和 AI 研究注入新活力。
即夢 3.0 模型在圖像生成領(lǐng)域?qū)崿F(xiàn)了重大技術(shù)飛躍,其能夠通過簡單的文字提示生成細(xì)節(jié)豐富、品質(zhì)卓越的圖像。與前代相比,該模型在場景布局、色彩搭配及細(xì)節(jié)刻畫上均有顯著提升,尤其在處理復(fù)雜場景時(shí)表現(xiàn)突出。即夢 3.0 的生成速度極快,極大地提高了創(chuàng)意迭代的效率,為設(shè)計(jì)師和創(chuàng)意工作者提供了強(qiáng)大的輔助工具。這一突破有望顛覆傳統(tǒng)圖像創(chuàng)作方式,開啟 AI 圖像生成的新紀(jì)元。
ComfyUI-Copilot 是一款結(jié)合自然語言處理與節(jié)點(diǎn)式工作流的創(chuàng)新工具,賦予用戶類似 GPT-4o 的圖像生成與編輯能力。它通過簡單的文字描述即可自動(dòng)完成 AI 流程,支持中英文交互,并集成多項(xiàng)實(shí)用功能,如模型推薦、錯(cuò)誤診斷等,顯著降低了 AI 圖像生成的使用門檻,提升了創(chuàng)作效率。
DomoAI 推出語音圖像生成數(shù)字人功能,用戶可上傳語音和圖像快速生成會說話的虛擬人物,支持口型同步及多種時(shí)長選擇。該功能旨在降低內(nèi)容創(chuàng)作門檻,推動(dòng) AI 與娛樂產(chǎn)業(yè)融合,已在社交平臺上引發(fā)熱烈討論,被視為數(shù)字內(nèi)容創(chuàng)作領(lǐng)域的重要革新。
Ready AI 是一款能快速生成專業(yè)級網(wǎng)頁界面的工具,用戶只需輸入文字指令即可在 30 秒內(nèi)獲得設(shè)計(jì)。它支持實(shí)時(shí)預(yù)覽、版本對比及多種框架選擇,并允許用戶自定義顏色風(fēng)格等細(xì)節(jié)。盡管生成內(nèi)容限于前端界面,需配合編程工具實(shí)現(xiàn)后端功能,但其高效便捷的特點(diǎn)仍受到設(shè)計(jì)圈的廣泛關(guān)注。
中國 AI 研究機(jī)構(gòu) DeepSeek 低調(diào)發(fā)布了 DeepSeek-V3-0324 模型,參數(shù)量達(dá) 685 億,顯著提升數(shù)學(xué)與編程能力,并采用更開放的 MIT 協(xié)議。此次更新雖未大肆宣傳,但已在技術(shù)社區(qū)引發(fā)熱烈反響,被視為挑戰(zhàn)行業(yè)巨頭的潛力股,且可能為 DeepSeek-R2 的發(fā)布奠定基礎(chǔ)。
阿里通義起源發(fā)布了全新超寫實(shí) 3D 數(shù)字人大模型 LHM,該模型能利用單視角輸入快速生成可驅(qū)動(dòng)的 3D 數(shù)字人,適用于動(dòng)作重現(xiàn)、游戲角色生成和虛擬現(xiàn)實(shí)探索等場景。LHM 的推出展示了 AI 在 3D 數(shù)字人領(lǐng)域的強(qiáng)大能力,預(yù)示著未來數(shù)字娛樂和虛擬現(xiàn)實(shí)的新可能。
這波AI工具浪潮中,哪項(xiàng)技術(shù)最可能顛覆你的行業(yè)?歡迎留言討論→
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計(jì)師平臺,提供獎(jiǎng)品贊助 聯(lián)系我們
品牌形象設(shè)計(jì)標(biāo)準(zhǔn)教程
已累計(jì)誕生 726 位幸運(yùn)星
發(fā)表評論 為下方 1 條評論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓