唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

昨天夜里,深夜驚雷。

一個(gè)新團(tuán)隊(duì)突然發(fā)了一個(gè)首款通用型的項(xiàng)目:Manus。演示在此,我人直接看麻了。

看完我的第一感覺,人類又要一敗涂地了。

這就是 OpenAI 的 DeepResearch 和 Claude 的 Computer Use 的究極集合體,甚至,他還能自己寫代碼,直接 Coding Agent。

我預(yù)想到這一天會(huì)來,只是沒想到,來的如此之早。

更多AI資訊:

Manus 在 GAIA 的評(píng)分上,也非常的離譜。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

已經(jīng)超越 OpenAI 的 DeepResearch 的了,成為 GAIA 評(píng)分第一。

可能很多人不知道 GAIA 是個(gè)啥,我簡(jiǎn)單說一下。

GAIA(General AI Assistants)是一個(gè)面向通用 AI 助手能力的基準(zhǔn)評(píng)測(cè)體系,由 Meta AI(FAIR)、Hugging Face 等研究團(tuán)隊(duì)于 2023 年提出。

有一篇非常著名的論文:

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

里面有 466 個(gè)精心設(shè)計(jì)的問題。

傳統(tǒng)的測(cè)試一般都是數(shù)學(xué)(AIME)或者一些專業(yè)知識(shí)問答、編程等等,但是 GAIA 測(cè)試,里面很多都是概念簡(jiǎn)單,但是需要多步驟解決的實(shí)際問題。

其中分為三個(gè)級(jí)別,Lv.1、Lv.2、Lv.3,難度依次遞增。

想通過 GAIA 的測(cè)試,一般需要網(wǎng)絡(luò)檢索能力、工具調(diào)用能力、編程能力、文件處理能力等等。

在 23 年的時(shí)候,人類一般能達(dá)到 90%的成功率,而那時(shí)候的最強(qiáng) AI GPT4,在第一級(jí)才勉強(qiáng)達(dá)到 15%。

再看這張圖,你就知道,有多強(qiáng)了。。。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

說實(shí)話,我目前還愿意為 ChatGPT 每個(gè)月都氪 200 刀,主要就是 o1 Pro 和DeepResearch,這倆有一說一,在我做一些研究和需要強(qiáng)推理任務(wù)的時(shí)候,還是非常好用的。

而 Manus 這波,把 DeepResearch 干碎了,要知道,它之前已經(jīng)是最強(qiáng)了。。。

Manus 網(wǎng)址在此: https://manus.im

現(xiàn)在有個(gè)很難頂?shù)膯栴}是封測(cè)中,所以只有邀請(qǐng)碼的用戶才能體驗(yàn)到。

所以,我也動(dòng)用了我的人脈,花了十分鐘的時(shí)間,聯(lián)系到了 Manus 團(tuán)隊(duì)的人,非常幸運(yùn)的獲得了邀請(qǐng)碼。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

不過,即使是沒有拿到邀請(qǐng)碼的用戶,也可以去他們官網(wǎng),大概看一下他們的 Use Case,每一個(gè),都非常的有意思。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

而如果你有了邀請(qǐng)碼,正常登錄進(jìn)去以后,就是一個(gè)大大的界面:

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

雖然都是一個(gè)對(duì)話框,但是 Manus 的能力還不太一樣,他不是那個(gè)你提出個(gè)問題,AI 一會(huì)就會(huì)直接給你回答 Chatbot。

而是當(dāng)你提出問題之后,他會(huì)根據(jù)你的問題和要求,來拆解任務(wù),進(jìn)行極度復(fù)雜的任務(wù)規(guī)劃和執(zhí)行。

并且會(huì)在云端自動(dòng)運(yùn)行,你可以直接退出出去,等運(yùn)行完了,會(huì)通知你。

比如之前的那篇 GAIA 的論文,我想把 PDF 變成一個(gè)能拿出去講的 PPT,我把這個(gè)要求提給 Manus 的時(shí)候。

他會(huì)先把我的需求拆解。

我是這么說的:

  1. 我希望你寫一段 Python 程序,用 OCR 把這篇論文的 PDF 信息提取出來。
  2. 將 PDF 里面的信息總結(jié)成 PPT 大綱。
  3. 按照小米發(fā)布會(huì)的風(fēng)格,做一份給普通人科普用的 PPT。
  4. 給我 PPT 的下載文件。

他會(huì)開始花一點(diǎn)時(shí)間來理解。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

然后,在右邊的窗口上,運(yùn)行一個(gè)虛擬機(jī),準(zhǔn)備開始執(zhí)行操作。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

在虛擬機(jī)開啟之后,會(huì)第一時(shí)間,列一份 To Do List。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

然后,就會(huì)開始執(zhí)行第一個(gè)任務(wù),安裝 python 庫(kù)。

完成的項(xiàng)目,會(huì)全部在右邊的預(yù)覽窗口打 x。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

他們用了一個(gè)非常有趣的交互形式,就是實(shí)時(shí)加進(jìn)度同步。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

右邊的界面就像 PPT 一樣,不斷的下一頁(yè)下一頁(yè),讓你實(shí)時(shí)的看到,當(dāng)前這個(gè) Manus 正在做什么,你能看到它的每一點(diǎn)想法,每一個(gè)動(dòng)作,這個(gè)掌控感真的太強(qiáng)了。

即使要等很久,你看著他在一點(diǎn)一點(diǎn)執(zhí)行,這個(gè)感覺也真的很爽。

而右下角的任務(wù)步驟也可以展開,非常直觀的告訴你,大步驟進(jìn)行到哪一個(gè)階段了。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

交互做的極棒。

我這個(gè) case,只需要等大概幾分鐘以后,一個(gè) PPT 就出來了。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

看看 PPT。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

信息是沒問題的,就是這美感= =還是欠缺了一點(diǎn),但是在信息的排版和內(nèi)容質(zhì)量上,真的高到爆炸。

這個(gè)其實(shí)并不是特別能展示它的能力,我再展示另一個(gè),我曾經(jīng)試圖讓所有 Agent 嘗試的例子,幫我整理發(fā)票。

我經(jīng)常要出差,所以有一堆亂七八糟的發(fā)票需要讓公司報(bào)銷的,但是公司的大總管呢,制定了一個(gè) SOP,就是發(fā)票你不能直接打包給她,這樣太亂,所以需要做成一個(gè) excel 的模板,這樣她好對(duì)賬。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

就是這樣的,但是你知道,我要每個(gè)月把我的十幾張發(fā)票,都處理成表格,真的很麻煩。

所以,當(dāng)我抱著試試看的態(tài)度,把這個(gè)任務(wù)交給 Manus 的時(shí)候,我震驚了。

因?yàn)?,它成功了。。?/p>

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

我當(dāng)時(shí)就渾身發(fā)麻了,實(shí)在太牛逼了。你們懂那種,渾身觸電的感覺嗎。

我給大家過一下流程。

最開始,我的 Prompt 超級(jí)簡(jiǎn)單。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

就這么簡(jiǎn)簡(jiǎn)單單的一句話。

他在思考完以后,處理成了 8 步任務(wù)。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

然后,解壓壓縮包,安裝 OCR 依賴,提取發(fā)票,整理成表格等等等等。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

我什么也沒干,他就自己這么跑著。

9 分鐘以后,提示我任務(wù)完成了。

我一回來,就看到了了這個(gè)畫面。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

只有一個(gè)小地方?jīng)]填上,其他都是對(duì)的。

太離譜了,這還需要人干嗎?

我還用它,分析了一下阿里巴巴股票。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

同樣的 case,我們先看看 OpenAI 的 DeepResearch 的結(jié)果。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

質(zhì)量是不錯(cuò),很高,但是對(duì)比一下 Manus,那可讀性實(shí)在是有點(diǎn)不堪重負(fù)了。。。

Manus 直接把任務(wù)拆解成了 8 步。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

最重要的是,當(dāng)他們完成的時(shí)候,所輸出的內(nèi)容。

當(dāng)我看到所謂的報(bào)告,給出的是一個(gè)鏈接的時(shí)候,我就猜到,這個(gè)事情有點(diǎn)不簡(jiǎn)單了。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

點(diǎn)進(jìn)去以后,果然。。。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

不僅圖文并茂,這尼瑪,這些圖標(biāo)圖表居然是可以交互的。。。

我真的給跪了,我想給 Manus 磕一個(gè)。

然后今天 QwQ 不是開源了 32B 的推理模型嗎,我又讓 Manus 隨手做了一個(gè)千問開源的時(shí)間線。

在經(jīng)歷了 30 多分鐘后,一張時(shí)間線的地圖就出來了。大家可以驗(yàn)證一下看看準(zhǔn)不準(zhǔn)。。。

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

我無話可說,人已跪地。

短短的幾個(gè)小時(shí)的體驗(yàn)時(shí)間

人類真的即將,一敗涂地。

在 Manus 的 prompt 技巧上,我自己試了下,你的點(diǎn),一定要足夠的清晰,描述越清晰具體,Manus 就能執(zhí)行得越精準(zhǔn)。

明確說明你的期望、格式要求和質(zhì)量標(biāo)準(zhǔn),可以大幅提升最終交付物的匹配度。

這一點(diǎn),非常重要。

2025 年 3 月 6 日,我覺得,即使在 AI 圈,也是一個(gè)值得銘記的日子。

阿里開源 QwQ-32B,以如此規(guī)模在性能上追平 DeepSeek R1 滿血版,另一邊,Manus 一夜崛起,把 Agent 工程帶上了一個(gè)新的高度。

而這兩個(gè)團(tuán)隊(duì),都屬于我們中國(guó)。

沒錯(cuò),都是中國(guó)團(tuán)隊(duì)。

為之自豪吧。

今夜的這一片星空,屬于 China。

宇宙,正在為我們而閃爍。

歡迎關(guān)注作者的微信公眾號(hào):數(shù)字生命卡茲克

唯有驚嘆!一手體驗(yàn)首款通用Agent產(chǎn)品Manus

收藏 35
點(diǎn)贊 81

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。