Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

AI 這個行業(yè)真的卷生卷死,凌晨 2 點半,剛想早睡一點點,9 點起來蹲 DeepSeek 的開源。

結(jié)果,Claude 直接玩偷襲了。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

Claude 3.7 Sonnet 來了,也是 Claude 家族,第一個能推理的模型。

還掏出了他們自己的 AI 編程工具。

一個一個說吧。。。我真的很想睡覺啊。。。

更多AIGC最新資訊:

一、Claude 3.7 Sonnet

網(wǎng)站鏈接:https://claude.ai/

Claude 3.7 Sonnet 跟市面上的其他推理模型有點不一樣,也印證了之前 TheInformation 的爆料,這一次的 Claude 3.7 Sonnet,是一個混合推理模型。

簡單的說,就是 Claude 3.7 Sonnet 即是一個普通的大模型,也是一個推理模型,你可以理解為把 DeepSeek V3 和 R1 直接揉在了一起。

切換模式使用下拉菜單去控制。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

分為普通模式和擴展(其實就是推理)模式。

普通模式下,它就是個升級版 Claude 3.5 Sonnet,回答迅速,跟以前一樣流暢,牛逼了一些,沒啥大區(qū)別。

如果你想讓它認真思考,比如一些數(shù)學(xué)、物理、編程、復(fù)雜分析場景,就可以切換到擴展模式,這時它就會跟 R1 和 o1 一樣,開始思維鏈展開,自己推理。

比如說我就用普通模式去問,會發(fā)現(xiàn)跟之前差不多。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

但是切換到擴展模式,他就會開始思考了。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

整體坦率的講,在交互上跟其他的推理模型都一個樣。

能力還是那些老能力,在數(shù)學(xué)、物理、遵循指令、編碼以及許多其他任務(wù)上的表現(xiàn)上會更強。

然后我還發(fā)現(xiàn)一個非常 der 比的事情,就是他都說自己是混合模型了,我以為我可以有無縫的體驗,在一個對話窗口中可以實現(xiàn)普通模型和擴展模型來回切換的體驗,甚至有一些黑科技加持。

結(jié)果。。。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

這個 New chat 看到?jīng)],一點就切換到一個新窗口了。。。

不是,DeepSeek 都能在一個對話窗口上進行 R1 和 V3 的隨時切換呢,你這是干啥啊。。。

但是有一說一,Claude 的文筆是真的好啊,在推理能力的加持下,感覺寫出來的內(nèi)容,味道更正,更真人了,甚至,劇情的邏輯都更順了。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

不過,這些都不重要,Claude 最牛逼的東西,還是它的編程。

非推理模型加持下的 Claude 3.5,就能跟 o1 打的有來有回,甚至至今還是 cursor 他們認為最優(yōu)的模型。

而 Claude 3.7,直接就是屬于斷檔式把其他人按在地上摩擦了。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

在遵循指令、一般推理、多模態(tài)能力和自主編碼方面的表現(xiàn)都很牛逼,特別是加了推理之后,在數(shù)學(xué)和科學(xué)方面也是一飛沖天。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

然后有一個是我覺得最騷的基準,就是他們讓 Claude 3.7 Sonnet,玩寶可夢紅。。。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

一款非常老但是非常經(jīng)典的游戲,整個寶可夢系列的第一世代。

他們給了 Claude 配備了基本的內(nèi)存、屏幕像素輸入和按鍵操作功能,讓 Claude 開著擴展思維去玩寶可夢,最后結(jié)果是這樣的。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

之前的版本在游戲早期就直接廢了,Claude 3.0 Sonnet 甚至沒能出新手村。。。

但是 Claude 3.7 Sonnet 的 AI 代理(Agent)的能力就非常強,成功挑戰(zhàn)了三個道館的館主,贏了他們的徽章。

非常的有意思,可以非常直觀的看出來,Claude 3.7 Sonnet 在編程、代理、數(shù)學(xué)等等的能力上,幾乎有了質(zhì)的飛躍。

AI 編程這個領(lǐng)域,看來又要前進一大步了。

在 API 的定價上,Claude 3.7 Sonnet 每百萬輸入是 3 美刀,美百萬輸出是 15 美刀,最長能干到 128k 的輸出,通過 prompt caching 可節(jié)省高達 90%的成本,通過 batch processing 可節(jié)省 50%的成本,整體還是稍微良心一點的。

不過跟 DeepSeek 這種價格屠夫比起來,還是有不少距離,但是也比 OpenAI 好了。。。

主要還是 DeepSeek 實在太便宜了。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

在推理控制上,開發(fā)者還是比較自由的,甚至可以設(shè)置“思維預(yù)算”,精確控制 Claude 在一個問題上花費的時間。

整體來說,Claude 3.7 Sonnet 還是非常香的。

當然,如果他不封號且格局不是那么小的話,會更好。。。

二、Claude Code

他們自己的類似于 Cursor 的 AI 編程工具。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

可以搜索和閱讀代碼,編輯文件,編寫和運行測試,提交并推送代碼到 GitHub,并使用命令行工具。

他們自己的界面,也非常的命令行。

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

目前開放了限量預(yù)覽,有興趣的可以去這個地方查看所有的詳情:https://docs.anthropic.com

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

整個手冊已經(jīng)寫的非常詳細了,我就不過多贅述了。

但是對于一些剛開始我那 AI 編程的或者是沒代碼知識的,我還是無腦建議 Trae 或者 Cursor。

寫在最后

AI 圈的進化速度實在是太快了,前腳馬斯克的 Grok3 地球最聰明的稱號屁股還沒坐熱,Claude 3.7 Sonnet 直接殺出來了。

而且把模型的上限,再一次拔高了一個臺階。

這就是 AI 的江湖啊,深刻的感覺到了連睡覺都是罪過。

早上 9 點還要起來蹲 DeepSeek 的開源。

你們就卷吧,AI 公司肯定沒啥事,第一個卷死的一定是 AI 自媒體。。。

但這就是 AI 時代最刺激的部分。

沒得覺睡,也開心。

畢竟,每天都在見證歷史。

你說呢。

歡迎關(guān)注作者的微信公眾號:數(shù)字生命卡茲克

Claude 3.7 Sonnet深夜上線,AI編程的天又被捅破了

收藏 13
點贊 20

復(fù)制本文鏈接 文章為作者獨立觀點不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。