亚洲av无码av制服丝袜在线,新版福利视频在线观看,婷婷四虎东京热无码群交双飞视频,我把护士日出水了视频90分钟,无码人妻精品一区二区三区99不卡

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

就在這兩天,美團(tuán)悄悄地開源了一個(gè)名叫龍貓(LongCat-Flash)的大模型。
可以說是眼下AI圈最重磅、也最低調(diào)的一個(gè)大新聞。

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

為什么?因?yàn)辇堌埐粌H性能追平了DeepSeek-V3.1,推理速度嘎嘎快,而且可能根本沒用英偉達(dá)的GPU來訓(xùn)練!現(xiàn)在全球AI算力被英偉達(dá)牢牢攥在手里,這個(gè)消息要是真的,那可就不只是一個(gè)新模型發(fā)布這么簡單了。這背后,是一條我們自己悄悄跑通的、不被卡脖子的通天大道。

龍貓

先別急著聊國產(chǎn)芯這么宏大的話題,先來看看這只龍貓本身到底有多能打。測試地址:longcat.chat

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

我研究了一下官方公布的數(shù)據(jù)和各路大神的評測,總結(jié)下來就是三個(gè)詞:快、準(zhǔn)、還便宜。

先說快,它的推理速度,官方數(shù)據(jù)是在H800的顯卡上能跑到100 token/s?,F(xiàn)在市面上主流的開源模型,速度普遍在20-50 token/s這個(gè)區(qū)間。也就是說,龍貓的反應(yīng)速度可能是它們的兩倍甚至更多!就好比跟AI聊天,以前是它想半天回一句,現(xiàn)在是剛說完,它嗖一下就把答案給你了,體驗(yàn)感直接拉滿。

再說準(zhǔn),從各種基準(zhǔn)測試跑分來看,龍貓的成績相當(dāng)能打。

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

尤其是在Agent工具調(diào)用的單項(xiàng)上,它的表現(xiàn)異常亮眼,甚至超過了之前很火的Kimi-K2,達(dá)到了目前開源模型的頂尖水平??赡艽蠹覍gent工具調(diào)用有點(diǎn)陌生,我打個(gè)比方:這就好比你給AI一個(gè)復(fù)雜的指令,比如“幫我查一下最近去三亞的特價(jià)機(jī)票,整理成表格,再找出評分最高的三家海景酒店”,強(qiáng)大的智能體就能自己上網(wǎng)搜索、分析數(shù)據(jù)、整理信息,最后把結(jié)果完整地呈現(xiàn)給你。這項(xiàng)能力,正是大模型從聊天玩具走向生產(chǎn)力工具的關(guān)鍵。

最后是便宜,龍貓的推理成本做到了驚人的每百萬token僅需0.7美元。看到這里你肯定會(huì)好奇,美團(tuán)到底用了什么魔法,能讓龍貓又快又好?官方技術(shù)文檔中詳細(xì)講了龍貓的技術(shù)架構(gòu),有兩個(gè)非常有意思的創(chuàng)新,堪稱效率壓榨的藝術(shù)。

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

第一個(gè)叫零計(jì)算專家(Zero-Computation Experts)。我們平時(shí)說話寫文章,里面有大量的詞其實(shí)很簡單,比如“的、地、得”這些助詞,還有各種標(biāo)點(diǎn)符號。傳統(tǒng)的AI模型處理這些簡單符號,也要消耗算力,有點(diǎn)殺雞用牛刀的意思。而龍貓就聰明多了。它內(nèi)部的路由會(huì)先判斷一下任務(wù)的難度,如果發(fā)現(xiàn)只是個(gè)標(biāo)點(diǎn)符號或者常用詞,就直接把它扔給零計(jì)算專家,幾乎不花什么力氣就處理完了。

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

簡單的任務(wù)快速通過,復(fù)雜的任務(wù)精雕細(xì)琢,整體效率不就上去了嗎?這也是為什么它的激活參數(shù)量不是固定的,而是在18.6B到31.3B之間動(dòng)態(tài)變化的原因。

第二個(gè)叫快捷連接架構(gòu)(ScMoE) 。傳統(tǒng)AI模型在訓(xùn)練時(shí),各個(gè)專家計(jì)算單元之間需要大量的數(shù)據(jù)交換,很多時(shí)間都在等數(shù)據(jù),算力被白白浪費(fèi)了??梢韵胂蟪梢粋€(gè)大公司里有很多專家,但這些專家分布在不同樓層,每次開會(huì)(計(jì)算)前,都需要坐電梯(數(shù)據(jù)傳輸)到同一個(gè)會(huì)議室。ScMoE干了件絕妙的事情,它在等待數(shù)據(jù)傳輸?shù)倪@點(diǎn)垃圾時(shí)間里,硬是把下一層的計(jì)算任務(wù)給塞了進(jìn)去,讓計(jì)算和通信并肩作戰(zhàn)。

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

這就好比我們一邊等水燒開,一邊把菜給洗了,時(shí)間利用率瞬間翻倍。通過這種方式,訓(xùn)練和推理的效率自然也就跟著起飛了。

外賣巨頭的求生欲

再聊回美團(tuán)本身,很多人可能會(huì)覺得奇怪,一個(gè)送外賣、賣菜、搞團(tuán)購的公司,為什么要這么拼命地去啃AI這塊硬骨頭?如果你關(guān)注財(cái)經(jīng)新聞,可能知道美團(tuán)最近的日子不太好過。為了和京東、淘寶在本地生活領(lǐng)域打價(jià)格戰(zhàn),外賣業(yè)務(wù)虧損嚴(yán)重,公司的利潤大幅下滑。對于美團(tuán)這樣一個(gè)擁有龐大線下團(tuán)隊(duì)的公司來說,最大的一塊成本就是人力。這是它繞不開的痛。

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

美團(tuán)準(zhǔn)備了兩條路。一條是搞無人機(jī)、無人車送貨,但這替代的范圍畢竟有限。另一條,就是搞大模型。

美團(tuán)CEO王興很早就預(yù)言過,大模型能讓“說話即可訂餐、訂酒店”成為現(xiàn)實(shí)。就是用技術(shù)為現(xiàn)有業(yè)務(wù)賦能,降低成本,提高效率。搞大模型也有兩條路:一是直接用別家成熟的模型,比如DeepSeek做二次開發(fā),二是自己從頭開始,訓(xùn)練一個(gè)完全屬于自己的模型。很顯然,美團(tuán)選了更難走,但也更有想象力的路。

好了,鋪墊了這么多,終于要說到這次事件中最讓人浮想聯(lián)翩的部分了。最早是@01Founder爆出來的,說經(jīng)過多方信源交叉確認(rèn),龍貓的訓(xùn)練并非在我們熟知的英偉達(dá)GPU上完成。美團(tuán)在官方報(bào)告里也只是用了數(shù)萬個(gè)加速卡這樣模糊的表述,對于具體的硬件廠商名字,諱莫如深。雖然美團(tuán)官方對此不作回應(yīng),但這背后傳遞的信號已經(jīng)足夠清晰和震撼了。

在當(dāng)下的AI時(shí)代,英偉達(dá)的GPU幾乎就是鐵鍬的代名詞。你想淘金,就必須得有它的高端顯卡。而我們都知道,由于眾所周知的原因,想拿到這些高端鐵鍬是越來越難了。如果美團(tuán)真的在國產(chǎn)加速卡上,訓(xùn)練出龍貓這樣性能比肩世界一流水平的大模型,那意義就太重大了。

這不僅僅是美團(tuán)一家的勝利,它證明了在AI這條最核心的賽道上,我們已經(jīng)有能力建立一套自主可控的技術(shù)路徑,可以不依賴、不仰視任何人。這就像在所有人都認(rèn)為只有坐遠(yuǎn)洋巨輪才能橫跨大洋的時(shí)候,我們自己造出了一艘同樣快速、甚至更經(jīng)濟(jì)的飛機(jī)。其中的艱辛,恐怕只有親身經(jīng)歷過的工程師才能體會(huì)。

如果這個(gè)傳聞屬實(shí),那龍貓的意義,就遠(yuǎn)遠(yuǎn)超出了一個(gè)開源模型本身。是給整個(gè)中國的AI產(chǎn)業(yè),打了一劑強(qiáng)心針。龍貓模型遵循MIT開源協(xié)議,這意味著可以完全免費(fèi)地將它用于商業(yè)用途,沒有任何后顧之憂。

外賣巨頭變AI黑馬:美團(tuán)龍貓技術(shù)拆解,動(dòng)態(tài)參數(shù)+ScMoE架構(gòu)顛覆行業(yè)

美團(tuán)這也是在用自己的技術(shù)積累,為整個(gè)中文AI生態(tài)添磚加瓦。AI,是能把效率拉到極致的武器。這一次,美團(tuán)賭的不是一城一地的得失,而是下一個(gè)時(shí)代。

你覺得,它賭對了嗎?

收藏
點(diǎn)贊 28

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。

榜上有名 聯(lián)系優(yōu)設(shè)

行業(yè)風(fēng)向標(biāo)!13年助力企業(yè)品牌宣發(fā)

渠道豐富
場景多樣
搜索引擎
極速收錄
內(nèi)容推廣
量身打造
品牌流量
助力曝光

文章目錄

發(fā)評論!每天贏獎(jiǎng)品

點(diǎn)擊 登錄 后,在評論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品

2012年成立至今,是國內(nèi)備受歡迎的設(shè)計(jì)師平臺,提供獎(jiǎng)品贊助 聯(lián)系我們

本期獎(jiǎng)品

發(fā)表評論

{{ moreBtnTxt }}

熱門品牌

1 聯(lián)系優(yōu)設(shè)

QQ直接交流

2 微信掃碼咨詢

返回頂部

榜上有名 聯(lián)系優(yōu)設(shè)

行業(yè)風(fēng)向標(biāo)!13年助力企業(yè)品牌宣發(fā)

渠道豐富
場景多樣
搜索引擎
極速收錄
內(nèi)容推廣
量身打造
品牌流量
助力曝光

聯(lián)系優(yōu)設(shè)

量身打造推廣方案
新聞通稿投放量增價(jià)更優(yōu)
優(yōu)設(shè)微信二維碼
掃描上方微信號:uisdc5687
商務(wù)號添加請務(wù)必說明來意

基礎(chǔ)版

單篇發(fā)布

極速收錄品牌通稿

998 元/1篇
 

基礎(chǔ)版服務(wù)權(quán)益

  • 通稿在優(yōu)設(shè)首頁新聞位曝光
  • 行業(yè)新聞首頁推薦位曝光
  • 發(fā)布當(dāng)日添加最新資訊標(biāo)識
  • 指導(dǎo)并優(yōu)化通稿文章
 

優(yōu)享版

套餐價(jià)!限時(shí)特惠!

12篇!每月都傳品牌好消息

6500 元/12篇
¥11976元/12篇
包含 基礎(chǔ)版 全部權(quán)益

優(yōu)享版年度新增權(quán)益

 
限時(shí)特惠!節(jié)省超45%

大客戶尊享版

尊享價(jià)!絕無僅有!

產(chǎn)品引流及品牌曝光雙管齊下

15990
¥20000元
包含 優(yōu)享版 全部權(quán)益

大客戶尊享版新增權(quán)益

  • 尊享優(yōu)設(shè)主編定制推文1篇
  • 400W微博 @優(yōu)設(shè)AIGC 發(fā)布推文
  • 定制產(chǎn)品視頻宣發(fā)(僅限AI產(chǎn)品)
 
絕無僅有!節(jié)省超20%
掃描左側(cè)二維碼 聯(lián)系優(yōu)設(shè)

聯(lián)系優(yōu)設(shè)

量身打造推廣方案
新聞通稿投放量增價(jià)更優(yōu)
優(yōu)設(shè)微信二維碼
掃描上方微信號:uisdc5687
商務(wù)號添加請務(wù)必說明來意

基礎(chǔ)版

單篇發(fā)布

極速收錄品牌通稿

998 元/1篇
 

基礎(chǔ)版服務(wù)權(quán)益

  • 通稿在優(yōu)設(shè)首頁新聞位曝光
  • 行業(yè)新聞首頁推薦位曝光
  • 發(fā)布當(dāng)日添加最新資訊標(biāo)識
  • 指導(dǎo)并優(yōu)化通稿文章
 

優(yōu)享版

套餐價(jià)!限時(shí)特惠!

12篇!每月都傳品牌好消息

6500 元/12篇
¥11976元/12篇
包含 基礎(chǔ)版 全部權(quán)益

優(yōu)享版年度新增權(quán)益

 
限時(shí)特惠!節(jié)省超45%

大客戶尊享版

尊享價(jià)!絕無僅有!

產(chǎn)品引流及品牌曝光雙管齊下

15990
¥20000元
包含 優(yōu)享版 全部權(quán)益

大客戶尊享版新增權(quán)益

  • 尊享優(yōu)設(shè)主編定制推文1篇
  • 400W微博 @優(yōu)設(shè)AIGC 發(fā)布推文
  • 定制產(chǎn)品視頻宣發(fā)(僅限AI產(chǎn)品)
 
絕無僅有!節(jié)省超20%
掃描左側(cè)二維碼 聯(lián)系優(yōu)設(shè)