趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

往期回顧:

一、Perplexity 推出 AI 驅(qū)動(dòng)瀏覽器 Comet

Perplexity 推出首款 AI 驅(qū)動(dòng)網(wǎng)頁(yè)瀏覽器 Comet,旨在挑戰(zhàn)谷歌搜索作為用戶獲取信息主要途徑的地位。該瀏覽器初期向每月 200 美元的 Max 計(jì)劃訂閱者及少量等待名單邀請(qǐng)用戶開放,核心特色是預(yù)裝并默認(rèn)設(shè)置 Perplexity 的 AI 搜索引擎,突出展示其核心產(chǎn)品 ——AI 生成的搜索結(jié)果摘要。同時(shí),瀏覽器內(nèi)置全新 AI 助手 Comet Assistant,可自動(dòng)完成日常任務(wù),如總結(jié)郵件和日歷事件、管理標(biāo)簽頁(yè)、代用戶瀏覽網(wǎng)頁(yè)等,用戶可通過側(cè)邊欄調(diào)用該助手,使其查看網(wǎng)頁(yè)內(nèi)容并解答相關(guān)問題。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

二、谷歌發(fā)布 32 個(gè) T5Gemma 模型

谷歌發(fā)布編碼器 - 解碼器架構(gòu)的 T5Gemma 系列模型,同時(shí)還推出了用于健康 AI 開發(fā)的多模態(tài)模型 MedGemma。T5Gemma 采用 “適應(yīng)” 技術(shù),將預(yù)訓(xùn)練的僅解碼器模型轉(zhuǎn)換為編碼器 - 解碼器架構(gòu),可靈活組合不同大小模型,平衡質(zhì)量與效率。實(shí)驗(yàn)顯示,T5Gemma 在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,尤其在推理密集型任務(wù)上,相比僅解碼器的 Gemma 2 有顯著提升,被認(rèn)為可能推動(dòng)編碼器 - 解碼器架構(gòu)復(fù)興。MedGemma 包含 4B 和 27B 大小的模型,能輔助醫(yī)療診斷,表現(xiàn)良好。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

三、馬斯克 xAI 發(fā)布 Grok4

馬斯克旗下 AI 公司 xAI 發(fā)布最新旗艦大模型 Grok 4 及多智能體版本 Grok 4 Heavy,并推出每月 300 美元的高價(jià)訂閱計(jì)劃 Super Grok Heavy。在 “人類的最后考試” 中,Grok 4 無工具時(shí)準(zhǔn)確率 25.4%,超谷歌 Gemini 2.5 Pro 和 OpenAI o3;Grok 4 Heavy 帶工具得分 44.4%,表現(xiàn)亮眼。其在多學(xué)科測(cè)評(píng)中成績(jī)優(yōu)異,馬斯克稱其科研能力超人類博士,還能處理源代碼文件。此外,Grok 4 已在庫(kù)存管理、游戲創(chuàng)作等領(lǐng)域落地,未來還將推出編碼、多模態(tài)、視頻生成等模型,與 OpenAI 的 GPT-5 形成競(jìng)爭(zhēng)態(tài)勢(shì)。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

四、新版 PNG 格式發(fā)布

新版 PNG 格式規(guī)范發(fā)布,沉寂 20 余年的 PNG 格式重?zé)ɑ盍ΑC绹?guó)國(guó)會(huì)圖書館等機(jī)構(gòu)均推薦該格式,此次更新由 Adobe、蘋果、谷歌等多巨頭參與推動(dòng)。新功能包括:一是完善 HDR 支持,僅用 4 字節(jié)即可實(shí)現(xiàn),且具備前瞻性;二是正式認(rèn)可 APNG 動(dòng)畫格式,此前該格式已獲廣泛支持;三是官方支持 Exif 數(shù)據(jù),可存儲(chǔ)版權(quán)、GPS 等附加信息,同時(shí)還進(jìn)行了錯(cuò)誤修正和說明澄清等整理工作。目前,Chrome、Safari、Photoshop 等眾多程序已支持新版 PNG 規(guī)范,廣播領(lǐng)域的硬件和工具也在更新適配。后續(xù)計(jì)劃推出第四版更新以提升 HDR 與 SDR 的互操作性,第五版將研究壓縮優(yōu)化及并行編解碼功能。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

五、B 站推“代號(hào) H”AI 創(chuàng)作工具

B 站推出 “代號(hào) H” AI 創(chuàng)作工具,聚焦視頻播客領(lǐng)域,該工具可實(shí)現(xiàn)音頻內(nèi)容視頻化,支持文案、音頻輸入,適配播客和泛知識(shí)雜談圖文模板,能在 6 分鐘內(nèi)生成千字內(nèi)容視頻,未來預(yù)計(jì)縮至 3 分鐘,定向邀請(qǐng)用戶體驗(yàn)反饋超預(yù)期。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

六、京東推出兩款 AI 社交產(chǎn)品

京東在其 App 內(nèi)推出兩款 AI 社交產(chǎn)品 “寵 TA” 和 “聊愈小宇宙”,虎牙則推出首個(gè) AI 助手產(chǎn)品 “小虎 AI 加工坊”。“寵 TA” 是以寵物為中心的 AI 社區(qū)產(chǎn)品,用戶可與寵物或?qū)櫸飻?shù)字人形象的智能體聊天,兼具換裝、寵物數(shù)字人等可玩性功能,還設(shè)有寵物醫(yī)生咨詢、食品購(gòu)買專區(qū),將情感陪伴與消費(fèi)場(chǎng)景結(jié)合,形成 “邊玩邊買” 閉環(huán)?!傲挠∮钪妗?是 AI 類對(duì)話產(chǎn)品,能識(shí)別用戶情緒,提供情緒記錄、解壓游戲等服務(wù),用戶可與 AI 心理咨詢師聊天,還可在 “微光社區(qū)” 交流,同時(shí)提供專業(yè)心理咨詢師付費(fèi)服務(wù),增強(qiáng)用戶認(rèn)同感。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

七、字節(jié)上線“小荷 AI 醫(yī)生”

字節(jié)首款 AI 醫(yī)療助手獨(dú)立 App “小荷 AI 醫(yī)生” 上線,定位健康管家,提供健康咨詢、報(bào)告解讀等服務(wù)。用戶注冊(cè)登錄后進(jìn)入對(duì)話界面,可咨詢疾病自查、用藥參考等健康問題,AI 會(huì)主動(dòng)收集關(guān)鍵信息(如癥狀持續(xù)時(shí)間),并通過讓用戶上傳診斷報(bào)告、拍攝病灶圖片等方式,結(jié)合信息給出建議。其還能解讀血常規(guī)等報(bào)告,快速分析指標(biāo)異常,評(píng)估狀況并給出建議;支持拍攝藥盒查詢藥效說明。2024 年中國(guó) AI 醫(yī)療器械市場(chǎng)規(guī)模達(dá) 96.41 億元,預(yù)計(jì) 2025 年將達(dá) 242.3 億元,大廠競(jìng)速或重新定義 AI 健康邊界。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

八、vivo 發(fā)布端側(cè)多模態(tài)模型

vivo AI Lab 發(fā)布端側(cè)多模態(tài)模型 BlueLM-2.5-3B,參數(shù)量?jī)H 2.9B,專為端側(cè)設(shè)計(jì),緊湊高效。該模型融合文本與圖文理解推理能力,支持長(zhǎng)短思考模式切換及思考預(yù)算控制,可直接理解 GUI 界面。在 20 余項(xiàng)評(píng)測(cè)中表現(xiàn)突出:文本任務(wù)上,緩解多模態(tài)模型文本能力遺忘問題,與同規(guī)模文本模型效果相近,優(yōu)于同規(guī)模及更大規(guī)模多模態(tài)模型;多模態(tài)任務(wù)領(lǐng)先同規(guī)模模型,部分接近大規(guī)模模型;GUI 理解能力在同規(guī)模模型中領(lǐng)先,尤其中文場(chǎng)景表現(xiàn)優(yōu)異。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

九、騰訊元器接入微信支付 MCP

騰訊元器宣布正式接入微信支付 MCP,成為首個(gè)接入該支付解決方案的智能體開發(fā)平臺(tái)。這一舉措支持開發(fā)者在智能體上直接添加下單、贊賞、查詢訂單等功能,打通了智能體商業(yè)化的最后環(huán)節(jié)。開發(fā)者僅需通過簡(jiǎn)單的提示詞調(diào)用或工作流編排,就能快速接入微信支付 MCP,使智能體具備支付能力。目前,元器平臺(tái)已向開發(fā)者開放微信支付 MCP 的體驗(yàn)版本,正式版本將在資質(zhì)審核通過后開放。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

十、字節(jié)發(fā)布 Xverse 圖像生成模型

字節(jié)發(fā)布多主體控制生成模型 Xverse,可對(duì)設(shè)定的每個(gè)主體進(jìn)行精確控制,且不破壞圖像生成質(zhì)量,能應(yīng)對(duì)多主體、多光源、多風(fēng)格等場(chǎng)景。其核心是通過學(xué)習(xí) DiT 中文本流調(diào)制機(jī)制中的偏移量,實(shí)現(xiàn)對(duì)多個(gè)主體身份和語義屬性的一致控制,包含 T-Mod 適配器、文本流調(diào)制機(jī)制、VAE 編碼圖像特征模塊及兩種正則化技術(shù)等關(guān)鍵組成部分。對(duì)比測(cè)試顯示,Xverse 在單主體、多主體任務(wù)及整體表現(xiàn)上均優(yōu)于 MS-Diffusion、OmniGen 等領(lǐng)先技術(shù)。

趨勢(shì)搶先知!2025年7月值得關(guān)注的10條AI資訊

收藏 3
點(diǎn)贊 65

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。