AI 這個行業(yè)真的卷生卷死,凌晨 2 點半,剛想早睡一點點,9 點起來蹲 DeepSeek 的開源。
結(jié)果,Claude 直接玩偷襲了。
Claude 3.7 Sonnet 來了,也是 Claude 家族,第一個能推理的模型。
還掏出了他們自己的 AI 編程工具。
一個一個說吧。。。我真的很想睡覺啊。。。
更多AIGC最新資訊:
網(wǎng)站鏈接:https://claude.ai/
Claude 3.7 Sonnet 跟市面上的其他推理模型有點不一樣,也印證了之前 TheInformation 的爆料,這一次的 Claude 3.7 Sonnet,是一個混合推理模型。
簡單的說,就是 Claude 3.7 Sonnet 即是一個普通的大模型,也是一個推理模型,你可以理解為把 DeepSeek V3 和 R1 直接揉在了一起。
切換模式使用下拉菜單去控制。
分為普通模式和擴展(其實就是推理)模式。
普通模式下,它就是個升級版 Claude 3.5 Sonnet,回答迅速,跟以前一樣流暢,牛逼了一些,沒啥大區(qū)別。
如果你想讓它認真思考,比如一些數(shù)學(xué)、物理、編程、復(fù)雜分析場景,就可以切換到擴展模式,這時它就會跟 R1 和 o1 一樣,開始思維鏈展開,自己推理。
比如說我就用普通模式去問,會發(fā)現(xiàn)跟之前差不多。
但是切換到擴展模式,他就會開始思考了。
整體坦率的講,在交互上跟其他的推理模型都一個樣。
能力還是那些老能力,在數(shù)學(xué)、物理、遵循指令、編碼以及許多其他任務(wù)上的表現(xiàn)上會更強。
然后我還發(fā)現(xiàn)一個非常 der 比的事情,就是他都說自己是混合模型了,我以為我可以有無縫的體驗,在一個對話窗口中可以實現(xiàn)普通模型和擴展模型來回切換的體驗,甚至有一些黑科技加持。
結(jié)果。。。
這個 New chat 看到?jīng)],一點就切換到一個新窗口了。。。
不是,DeepSeek 都能在一個對話窗口上進行 R1 和 V3 的隨時切換呢,你這是干啥啊。。。
但是有一說一,Claude 的文筆是真的好啊,在推理能力的加持下,感覺寫出來的內(nèi)容,味道更正,更真人了,甚至,劇情的邏輯都更順了。
不過,這些都不重要,Claude 最牛逼的東西,還是它的編程。
非推理模型加持下的 Claude 3.5,就能跟 o1 打的有來有回,甚至至今還是 cursor 他們認為最優(yōu)的模型。
而 Claude 3.7,直接就是屬于斷檔式把其他人按在地上摩擦了。
在遵循指令、一般推理、多模態(tài)能力和自主編碼方面的表現(xiàn)都很牛逼,特別是加了推理之后,在數(shù)學(xué)和科學(xué)方面也是一飛沖天。
然后有一個是我覺得最騷的基準,就是他們讓 Claude 3.7 Sonnet,玩寶可夢紅。。。
一款非常老但是非常經(jīng)典的游戲,整個寶可夢系列的第一世代。
他們給了 Claude 配備了基本的內(nèi)存、屏幕像素輸入和按鍵操作功能,讓 Claude 開著擴展思維去玩寶可夢,最后結(jié)果是這樣的。
之前的版本在游戲早期就直接廢了,Claude 3.0 Sonnet 甚至沒能出新手村。。。
但是 Claude 3.7 Sonnet 的 AI 代理(Agent)的能力就非常強,成功挑戰(zhàn)了三個道館的館主,贏了他們的徽章。
非常的有意思,可以非常直觀的看出來,Claude 3.7 Sonnet 在編程、代理、數(shù)學(xué)等等的能力上,幾乎有了質(zhì)的飛躍。
AI 編程這個領(lǐng)域,看來又要前進一大步了。
在 API 的定價上,Claude 3.7 Sonnet 每百萬輸入是 3 美刀,美百萬輸出是 15 美刀,最長能干到 128k 的輸出,通過 prompt caching 可節(jié)省高達 90%的成本,通過 batch processing 可節(jié)省 50%的成本,整體還是稍微良心一點的。
不過跟 DeepSeek 這種價格屠夫比起來,還是有不少距離,但是也比 OpenAI 好了。。。
主要還是 DeepSeek 實在太便宜了。
在推理控制上,開發(fā)者還是比較自由的,甚至可以設(shè)置“思維預(yù)算”,精確控制 Claude 在一個問題上花費的時間。
整體來說,Claude 3.7 Sonnet 還是非常香的。
當然,如果他不封號且格局不是那么小的話,會更好。。。
他們自己的類似于 Cursor 的 AI 編程工具。
可以搜索和閱讀代碼,編輯文件,編寫和運行測試,提交并推送代碼到 GitHub,并使用命令行工具。
他們自己的界面,也非常的命令行。
目前開放了限量預(yù)覽,有興趣的可以去這個地方查看所有的詳情:https://docs.anthropic.com
整個手冊已經(jīng)寫的非常詳細了,我就不過多贅述了。
但是對于一些剛開始我那 AI 編程的或者是沒代碼知識的,我還是無腦建議 Trae 或者 Cursor。
AI 圈的進化速度實在是太快了,前腳馬斯克的 Grok3 地球最聰明的稱號屁股還沒坐熱,Claude 3.7 Sonnet 直接殺出來了。
而且把模型的上限,再一次拔高了一個臺階。
這就是 AI 的江湖啊,深刻的感覺到了連睡覺都是罪過。
早上 9 點還要起來蹲 DeepSeek 的開源。
你們就卷吧,AI 公司肯定沒啥事,第一個卷死的一定是 AI 自媒體。。。
但這就是 AI 時代最刺激的部分。
沒得覺睡,也開心。
畢竟,每天都在見證歷史。
你說呢。
歡迎關(guān)注作者的微信公眾號:數(shù)字生命卡茲克
復(fù)制本文鏈接 文章為作者獨立觀點不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機派送獎品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計師平臺,提供獎品贊助 聯(lián)系我們
品牌形象設(shè)計標準教程
已累計誕生 726 位幸運星
發(fā)表評論 為下方 6 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓