2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

一篇文章帶你回顧2024年,AIGC 領(lǐng)域的重磅產(chǎn)品和新模型。

更多AIGC 干貨:

一月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「趨勢」釘釘與 IDC 聯(lián)合發(fā)布的《2024 AIGC 應(yīng)用層十大趨勢白皮書》。

二月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」大模型 Sora 發(fā)布。美國人工智能研究公司 OpenAI 正式對外發(fā)布人工智能文生視頻大模型 Sora,該模型能夠根據(jù)用戶的文本提示創(chuàng)建最長 60 秒的逼真視頻。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「產(chǎn)品」字節(jié)跳動推出的一站式 AI Bot 開發(fā)平臺「扣子」正式發(fā)布;

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」谷歌發(fā)布 Gemini 大型語言模型。谷歌正式宣布將旗下 Bard AI 聊天機(jī)器人更名為 Gemini,并同步推出了專為安卓用戶打造的 Gemini 應(yīng)用。Gemini 是谷歌最新、最大規(guī)模且功能最為強(qiáng)大的大型語言模型,其發(fā)布進(jìn)一步推動了 AIGC 在對話和搜索引擎集成 AI 領(lǐng)域的發(fā)展。

三月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」Claude3 模型發(fā)布。該模型是 Anthropic 發(fā)布的最新 AI 大模型系列,包括 Claude 3 Haiku、Sonnet 和 Opus 三種型號。該系列模型在設(shè)計(jì)時考慮了提高對各種問題的響應(yīng)能力,特別是在處理復(fù)雜推理任務(wù)時表現(xiàn)出色。其中,Opus 模型在執(zhí)行高級推理 任 務(wù) 時 的 表 現(xiàn) 優(yōu) 于 OpenAI 的 GPT-4 和 谷 歌 的 Gemini Ultra。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」北大團(tuán)隊(duì)聯(lián)合兔展發(fā)布了 Open Sora 文生視頻大模型。旨在通過文本輸入生成視頻內(nèi)容。該模型是北大團(tuán)隊(duì)與兔展合作發(fā)起的 Sora 復(fù)現(xiàn)計(jì)劃的一部分,提供了完整的視頻生成解決方案,包括視頻數(shù)據(jù)預(yù)處理、加速訓(xùn)練、推理等。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」Yi-9B 大型語言模型。該模型是李開復(fù)旗下 AI 公司零一萬物開發(fā)的,Yi-9B 是一款具有 90 億參數(shù)的大型語言模型,特別加強(qiáng)了在代碼和數(shù)學(xué)方面的學(xué)習(xí)能力。該模型在代碼和數(shù)學(xué)能力上達(dá)到了前所未有的高度,同時保持了對消費(fèi)級顯卡的良好兼容性,為廣大開發(fā)者和研究人員提供了前所未有的便利性和強(qiáng)大功能。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」Stability AI 發(fā)布 SD3 大模型。采用了與 Sora 相同的 DiT(DiffusionTransformer)架構(gòu),生成的圖像質(zhì)量實(shí)現(xiàn)了顯著提升。該模型支持多主題提示,并改進(jìn)了文字書寫效果。Stability AI 表示,Stable Diffusion 3 在基于人類偏好的評估中優(yōu)于當(dāng)前最先進(jìn)的文本到圖像生成系統(tǒng)。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」蘋果公司發(fā)布了 MM1 大型多模態(tài)基礎(chǔ)模型 。MM1 是蘋果公司最新發(fā)布的一款大型多模態(tài)基礎(chǔ)模型,擁有 300 億參數(shù),采用了 MoE 架構(gòu)。該模型是蘋果在 AIGC 領(lǐng)域的重要布局之一,展示了蘋果在 AI 技術(shù)方面的深厚積累和創(chuàng)新實(shí)力。

四月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」 生數(shù)科技發(fā)布 Vidu 視頻生成大模型。生數(shù)科技發(fā)布了 Vidu 視頻生成大模型,該模型融合了 Diffusion 與 Transformer 技術(shù),開創(chuàng)性地創(chuàng)建了 U?ViT架構(gòu)。Vidu支持一鍵生成長達(dá)16秒、分辨率1080P 的高清視頻內(nèi)容,展現(xiàn)了 AIGC 在視頻生成領(lǐng)域的強(qiáng)大能力。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」昆侖萬維發(fā)布天工音樂大模型。昆侖萬維推出了天工音樂大模型,這是中國唯一公開可用的音樂 AIGC 模型。該模型的 AI 人聲合成技術(shù)達(dá)到了業(yè)內(nèi)領(lǐng)先水平,為音樂創(chuàng)作和生成提供了全新的解決方案。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」微軟發(fā)布 Phi-4 移動端大模型。微軟研究院發(fā)布了 Phi-4 移動端大模型,該模型延續(xù)了 Phi 系列的小參數(shù)模式,盡管只有 140 億參數(shù),但在多項(xiàng)基準(zhǔn)測試中表現(xiàn)出色,甚至在某些方面超越了參數(shù)更多的模型。Phi-4 的發(fā)布展示了微軟在移動端 AI 技術(shù)方面的實(shí)力。

五月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「發(fā)布」OpenAI 發(fā)布 GPT-4o。OpenAI 發(fā)布了 GPT 4的迭代產(chǎn)品——GPT-4o,并宣布向所有用戶開放。

這一消息的發(fā)布不僅提升了用戶對 ChatGPT 的興趣,也促使國內(nèi)大模型產(chǎn)品開始考慮降價策略以應(yīng)對競爭。GPT-4o 的發(fā)布進(jìn)一步推動了生成式 AI 技術(shù)的發(fā)展,為用戶提供了更高質(zhì)量的服務(wù)、更有趣的對話體驗(yàn)以及更有用的信息。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「產(chǎn)品」即夢 AI 正式上線,提供圖片生成和智能畫布等功能。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」阿里云在 AI 智領(lǐng)者峰會上發(fā)布了通義千問 2.5 版 本 , 并 開 源 了 1100 億 參 數(shù) 模 型 Qwen1.5-110B。相較于 2.1 版,2.5 版本在理解能力、邏輯推理、指令遵循及代碼能力上分別實(shí)現(xiàn)了 9%、16%、19%和 10%的提升。此外,通義還不斷拓展其應(yīng)用場景,新增了文生圖、智能編碼、文檔解析、音視頻理解等功能。

六月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」可靈 AI 發(fā)布可靈 1.5 模型,其產(chǎn)品被用于電影拍攝,九個導(dǎo)演已經(jīng)用它拍完片子。

七月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「產(chǎn)品」可靈宣布國際版 1.0 全球上線,同時國內(nèi)版本也進(jìn)行了基礎(chǔ)模型的升級,并全面開放內(nèi)測。

八月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」Flux.1 發(fā)布,包含專業(yè)版、開發(fā)者版和快速版三種模型。其中,專業(yè)版和開發(fā)者版在性能上擊敗了 SD3-Ultra 等主流模型,而快速版 FLUX.1 schnell也超越了 Midjourney v6.0、DALL·E 3 等更大的模型。

九月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「產(chǎn)品」阿里通義 AI 實(shí)驗(yàn)室宣布,將在即將舉行的云棲大會上推出一款創(chuàng)新視頻生成大模型。該模型的預(yù)約通道已在通義 App 及通義萬相 PC 平臺上開放,但具體使用權(quán)限尚未向公眾開放。這款大模型融合了“文生視頻”與“圖生視頻”兩大創(chuàng)意模式。

十月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」Flux 推出了 1.1 Pro 版本,并在 Beta 版中推出了 BFL API,進(jìn)一步提升了模型的性能和易用性。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」Stability AI 正式發(fā)布了其最新的 StableDiffusion 3.5 系列 AI 圖像模型。與前一版本相比,Stable Diffusion 3.5 在現(xiàn)實(shí)感、提示依從性以及文本渲染質(zhì)量方面均有顯著提升。

十一月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「模型」2024 年 11 月,超清 AI 圖像生成模型 FLUX1.1 Pro Ultra 發(fā)布,支持高達(dá) 4 兆像素的分辨率,生成速度大幅提升。

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「工具」ComfyUI:啟用了新 UI(Beta UI)作為默認(rèn)界面,提升了用戶體驗(yàn)

?十二月

2024 AIGC 行業(yè)重大事件回顧:可能改寫歷史的瞬間

「發(fā)布」OpenAI 12 天超長發(fā)布會。OpenAI 在 2024 年 12 月舉辦了一場為期 12 天的超長發(fā)布會,期間陸續(xù)發(fā)布了多款新產(chǎn)品和功能,包括完全體的 o1 推理模型、o1-mini 強(qiáng)化微調(diào)技術(shù)、Sora Turbo 視頻生成版本 、Canvas 工作臺 、ChatGPT 與 AppleIntelligence 的集成、高級語音模式、Projects 項(xiàng)目管理功能、升級后的 ChatGPT 搜索功能、o1 推理模型 API 開放、辯論游戲、Microscope 神經(jīng)網(wǎng)絡(luò)分析工具,以及新一代推理模型 o3。這些發(fā)布內(nèi)容不僅展現(xiàn)了 OpenAI 在 AI 領(lǐng)域的創(chuàng)新實(shí)力,也為 AI 產(chǎn)業(yè)的未來發(fā)展指明了方向。

收藏 27
點(diǎn)贊 38

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。