“Amazing?!?/p>
這是OpenClaw創(chuàng)始人Peter Steinberger昨天在社交平臺留下的一句評論。
讓Steinberger發(fā)出這句驚嘆的,是一張來自北京的照片:在百度科技園舉行的“龍蝦市集”現場,幾十臺電腦同時部署OpenClaw,開發(fā)者排隊等待工程師幫忙完成“養(yǎng)蝦”。
Steinberger同時表示,愿意與百度一同開發(fā)OpenClaw生態(tài)。
過去幾個月,這只“龍蝦”已經從一個開源項目,迅速演化為AI社區(qū)最受關注的實驗之一。
Steinberger本人也曾用一句頗具戲劇性的判斷來形容這種變化:隨著Agent能夠直接調用工具和服務,“未來的大多數應用,本質上可能都只是一個慢速API”。
也正因為如此,越來越多云廠商開始圍繞“養(yǎng)蝦”構建產品,希望把這個原本屬于開發(fā)者社區(qū)的工具,變成普通用戶也能使用的AI Agent服務。
在這場競速中,百度顯得尤為積極。
從時間線看,百度在這輪“養(yǎng)蝦”熱中的動作,從年初一直持續(xù)至今:年初推出可視化部署方案,通過輕量云服務器實現幾步完成OpenClaw安裝;2月,用戶在百度App中搜索“OpenClaw”即可直接喚起Agent助手。
近日,百度智能云發(fā)布的DuClaw則進一步取消服務器配置、鏡像選擇和API Key填寫,把原本復雜的部署流程變成訂閱即用的托管服務。
幾乎同時,百度還推出全球首款手機龍蝦應用、移動端形態(tài)的紅手指Operator,讓OpenClaw運行在云端虛擬手機環(huán)境中,實現跨App執(zhí)行任務。
如果把這些動作連在一起看,百度正在把OpenClaw生態(tài)改造成一套可持續(xù)運行的Agent服務體系。
龍蝦能不能跑起來,要看平臺的技術底座;龍蝦好不好用,要看平臺的Skill供給能力。
只有二者兼具的企業(yè),才能在這一輪“養(yǎng)蝦潮”中脫穎而出。
01
從DuClaw到紅手指:
Agent正在進入真實執(zhí)行環(huán)境
隨著以OpenClaw為代表的AI Agent框架迅速流行,一個比模型能力更現實的問題開始浮現:Agent不僅需要模型,更需要穩(wěn)定的運行環(huán)境與執(zhí)行環(huán)境。
過去兩年,AI學術界開始系統(tǒng)評估Agent在真實計算機環(huán)境中的能力。
2024年,來自斯坦福大學、卡內基梅隆大學和微軟研究院的研究團隊提出OSWorld基準測試,用完整操作系統(tǒng)作為實驗環(huán)境,構建了369個跨應用任務,覆蓋瀏覽器操作、文件管理、辦公軟件以及多應用協(xié)作等場景。
研究結果顯示,人類完成這些任務的成功率達到72.36%,而當時表現最好的多模態(tài)AI Agent(GPT-4V + Agent framework)成功率只有12.24%。
該研究指出,主要困難集中在GUI定位、操作順序理解以及跨應用流程管理等環(huán)節(jié)。
這一差距說明,Agent能力的瓶頸并不只在模型推理能力,而在于如何在真實系統(tǒng)中執(zhí)行任務。
這一問題在后續(xù)研究中進一步得到驗證。
2025年6月,卡內基梅隆大學等機構發(fā)布論文《OSWorld-Human》,對16個主流Agent系統(tǒng)進行評測。結果發(fā)現,即使在成功完成任務的情況下,AI代理通常仍需要1.4到2.7倍于人類的操作步驟。隨著任務鏈條變長,規(guī)劃和工具調用帶來的系統(tǒng)開銷會迅速放大。
該項研究指出:當前AI代理在真實系統(tǒng)中的表現,仍然遠遠落后于人類。問題并不只是模型推理能力,而是如何在復雜環(huán)境中持續(xù)執(zhí)行任務。
也正是在這樣的背景下,一批面向開發(fā)者的Agent框架開始出現,其中最受關注的就是OpenClaw。該框架把任務規(guī)劃、工具調用和模型推理組合成一套可復用系統(tǒng),使開發(fā)者能夠在真實環(huán)境中部署和運行AI代理。
但隨著OpenClaw在開發(fā)者社區(qū)走紅,一個現實問題很快出現:本地部署這件事,本身存在一定門檻。
運行OpenClaw通常需要配置云服務器、部署環(huán)境鏡像、接入模型API并維護運行權限。對于開發(fā)者來說,這些步驟尚可接受;但對普通用戶而言,復雜的環(huán)境配置、權限管理以及安全風險,使得本地部署難以大規(guī)模普及。
因此,OpenClaw的擴散很快從開源社區(qū)走向云平臺。
今年年初以來,包括百度智能云、阿里云、騰訊云以及火山引擎在內的多家云廠商,都開始提供云端部署方案,讓用戶可以在遠程服務器上運行OpenClaw,而不是在個人設備上搭建復雜環(huán)境。
其中,百度智能云推出的DuClaw與紅手指Operator,直接瞄準的是Agent系統(tǒng)中的兩層關鍵問題。
首先是運行環(huán)境。
DuClaw把OpenClaw原本復雜的部署流程封裝成一種托管運行環(huán)境。用戶不需要再配置服務器、鏡像或模型接口,只需在網頁端創(chuàng)建實例即可啟動Agent系統(tǒng)。
也就是說,DuClaw提供了一種“零部署服務”,讓普通用戶也可以直接使用托管Agent。這一過程中,任務規(guī)劃、模型調用和工具執(zhí)行都在云端完成,用戶只需要通過對話觸發(fā)任務。
而紅手指Operator對應的,則是另一層更現實的問題——Agent如何更貼近用戶。
紅手指提供的是一種云端虛擬手機環(huán)境。
紅手指在云端運行完整的手機操作系統(tǒng),使Agent可以直接操作真實應用,例如打車、信息查詢或跨應用任務。
這種方式繞開了現實互聯(lián)網的一大限制:許多互聯(lián)網服務并沒有開放API,或者接口能力有限。
在云手機環(huán)境中,Agent可以像用戶一樣點擊界面、輸入文本、切換應用,從而進入真實應用生態(tài)。
另一方面,在真實用戶場景中,經常都需要在多個App之間完成操作流程。例如跨境電商賣家需要在電商平臺、社交媒體和物流系統(tǒng)之間切換賬號進行運營;廣告和內容團隊則常常同時管理多個社交平臺賬號。
一些用戶會在云端運行安卓系統(tǒng)管理多個賬號、自動化運營或長期運行應用,而這些任務通常需要設備24小時在線并持續(xù)執(zhí)行腳本或操作流程。
紅手指+OpenClaw生態(tài)的結合,完美契合了這一類用戶需求。
這種架構的出現并非偶然。隨著OpenClaw用戶規(guī)模擴大,本地部署的安全和運維問題已經開始顯現。
微軟安全團隊在2026年2月的技術分析中指出,像OpenClaw這樣的代碼型Agent會在運行過程中不斷調用外部工具和插件,如果缺乏隔離環(huán)境,很容易形成新的安全風險。
在這種背景下,把Agent運行環(huán)境遷移到云平臺、把執(zhí)行任務放進隔離系統(tǒng),正在成為一種更可控的部署方式。
云部署的核心優(yōu)勢是穩(wěn)定可達。7×24小時在線,不依賴個人設備,適合做自動化任務調度、信息聚合、消息推送等對實時性有要求的場景。
在操作Agent的過程中,可以將主力的PC設備隔離在外,對本地信息進行有效保護,可以按需把需要操控的文件放入云端,避免因為不當操作造成文件損失。
這一模式適合想輕量體驗OC基礎功能、無需本地文件控制、對穩(wěn)定性和安全性要求高的普通用戶和中小企業(yè)。
DuClaw提供托管Agent運行環(huán)境,而紅手指的云手機則把任務執(zhí)行放進獨立系統(tǒng)中,本質上是為普通用戶提供可以放心使用、輕松交互的“養(yǎng)蝦”環(huán)境。
事實上,從各家推出的OpenClaw產品矩陣中不難發(fā)現,當下的Agent生態(tài)競爭重點已經發(fā)生變化:僅僅幫助用戶“落地”Agent還遠遠不夠,關鍵在于如何提供穩(wěn)定、長期的服務。
換言之,想要打造全能Agent生態(tài),首先需要的是“全能”AI云廠商。
02
全能Agent,
需要全能AI云廠商
如果說OpenClaw點燃了這一輪“養(yǎng)蝦潮”,那么真正決定這場潮水能否持續(xù)的,其實并不是框架本身,而是背后的AI基礎設施。
在產業(yè)研究中,這類能力已經被視為生成式AI產業(yè)鏈中的關鍵因素。
本月,美國計算機與通信行業(yè)協(xié)會(CCIA)委托經濟咨詢機構RBB Economics發(fā)布的一份關于亞太生成式AI競爭格局的報告指出,百度千帆、谷歌Vertex AI、亞馬遜Bedrock以及阿里云Model Studio都屬于同一類AI部署平臺。
報告指出,這類平臺的作用在于為開發(fā)者提供統(tǒng)一接口接入多個基礎模型,并配套模型管理、應用部署和開發(fā)工具,使企業(yè)能夠在不同模型之間比較、切換并構建完整AI系統(tǒng)。
隨著生成式AI應用從單次調用走向持續(xù)運行,越來越多企業(yè)傾向于通過這種平臺同時接入多個模型供應商,而不是綁定單一模型。這種“多模型接入”的結構,也使平臺層逐漸成為連接基礎模型與應用開發(fā)之間的重要基礎設施。
換句話說,Agent時代的第一道門檻,其實是算力和云環(huán)境。
只有具備穩(wěn)定算力、模型接入能力以及持續(xù)運行環(huán)境的平臺,才能把Agent從實驗工具變成可以規(guī)模化部署的服務。
在這一點上,百度的路徑顯得更加“平臺化”。
一直以來,百度在業(yè)內以擁有“完整AI技術棧”而著稱:從底層模型到云平臺,再到開發(fā)者工具和應用入口,百度擁有AI時代較為完整的技術體系。
算力是這條鏈條的最底層。
2025年4月,在百度Create開發(fā)者大會上,百度宣布點亮一個由3萬顆第三代昆侖P800芯片組成的計算集群。百度CEO李彥宏表示,該集群既可以訓練接近DeepSeek規(guī)模的大模型,也能夠支持上千個客戶同時進行模型微調。
對需要長期運行、頻繁調用的AI系統(tǒng)來說,這意味著平臺不僅具備模型訓練能力,也在為多租戶環(huán)境和高并發(fā)調用提供算力基礎。
再往上一層,是模型平臺。作為模型與應用開發(fā)平臺,千帆為開發(fā)者提供了全面的開發(fā)工具和部署能力。
針對最新推出的DuClaw,百度千帆推出Coding Plan訂閱服務,通過模型調度與訂閱計費壓低Agent成本:Lite版首購僅7.9元/月,每月可提供約1.8萬次請求額度,并支持DeepSeek、Kimi、GLM、MiniMax等模型切換。
這種結構對于Agent系統(tǒng)尤為重要。復雜任務往往需要多個模型配合完成,例如推理、代碼生成或工具調用等不同階段。
從Cursor為代表的Vibe Coding工具到今天的OpenClaw,Agent的運作邏輯早已不再是簡單的API接入。
百度千帆平臺已累計支持企業(yè)構建超130萬個Agents,工具日均調用次數達到數千萬級,支撐智能硬件、制造、交通、能源等主流行業(yè)創(chuàng)新,并沉淀出包含獲客營銷、錯題批改等在內的100多個高頻場景。
從模型訓練、開發(fā)接入到應用部署,百度已經形成了一套較為完整的技術體系,整個流程都可以在同一平臺內完成。
財報數據也在一定程度上反映了這套結構的運行情況。
上月,百度發(fā)布最新財報顯示,其AI相關業(yè)務在2025年第四季度收入已超過110億元,占公司核心業(yè)務收入的約43%。與此同時,AI云業(yè)務仍保持較快增長,成為百度當前最重要的增長來源之一。
也就是說,百度的AI云能力已經開始在企業(yè)市場形成規(guī)?;枨?,“全棧AI云”正在逐漸成為企業(yè)運行AI系統(tǒng)的基礎設施,也成為支撐DuClaw和紅手指穩(wěn)定運作的技術底座。
換言之,有能力同時提供算力、模型、平臺和應用入口的云廠商,才能在這一輪Agent浪潮中占據主動。
03
知識就是Skill:
為什么說百度更適合養(yǎng)“龍蝦”
如果說算力和模型構成了Agent生態(tài)的“硬實力”,那么真正決定Agent能力上限的,往往是另一層更隱性的能力。
2025年,美國東北大學、香港科技大學等機構的研究者在綜述論文《Large Language Model Agents: A Survey》中指出,在復雜任務中,大模型往往缺乏完整、實時且可驗證的外部知識。更可行的路徑,是把模型與檢索系統(tǒng)、數據庫、瀏覽器以及各類外部工具結合起來使用。
換句話說,Agent能力的邊界,往往取決于它能夠接入哪些工具和數據源,而不僅僅是模型本身的參數規(guī)模。
這也解釋了為什么Skill生態(tài)正在成為OpenClaw競爭的核心。
近期,瑞士AI安全公司Lakera在一份針對OpenClaw生態(tài)的安全分析報告中,對4310個公開Skill進行了審計,并對其中221個進行了深入研究。報告發(fā)現,這些Skill并不是簡單插件,而是能夠執(zhí)行真實代碼、申請OAuth權限、訪問本地資源的“可執(zhí)行能力包”。
這意味著,Skill的穩(wěn)定性和可信度直接關系到Agent系統(tǒng)的安全與可靠,也決定了誰能把Agent從演示推進到真正的生產環(huán)境。
把這個邏輯拉回到百度身上,真正的生態(tài)優(yōu)勢由此浮現出來。
作為搜索業(yè)務起家的互聯(lián)網公司,百度本就擁有一整套適合被Skill化的信息基礎設施。
搜索、百科、學術、地圖等能力過去面對的是用戶,現在被重新封裝后,面對的則是Agent。
對很多云廠商來說,Skill生態(tài)需要從零搭建;而對百度而言,許多底層能力是多年業(yè)務積累形成的。
在傳統(tǒng)互聯(lián)網時代,搜索解決的是“用戶如何找到信息”;而在Agent系統(tǒng)中,搜索更像是系統(tǒng)獲取信息、比較信息并繼續(xù)執(zhí)行任務的起點。
開源RAG框架RAGFlow團隊在2025年底的一篇技術回顧中提出,RAG正在從“檢索增強生成”演化為一種“上下文服務層”:它不僅負責檢索,還要完成意圖理解、多源數據協(xié)調、去重、排序和結構化輸出,再把結果送入模型推理流程。
從這個角度看,百度的搜索業(yè)務在Agent時代反而更具現實落地價值。
公開報道顯示,百度AI助手在今年初月活已突破2億,而且已經連接京東、美團、百度地圖、百度健康等服務,用戶還可以在不同模型之間切換,包括文心和DeepSeek。
也就是說,百度一直在嘗試把搜索入口、模型入口和服務入口整合為統(tǒng)一的AI入口。
很多真實任務本來就起于搜索、成于服務,這種路徑天然更適合落地Agent場景。這也構成了百度與許多只提供算力或模型的平臺之間的重要差別。
百度長期積累的搜索、百科和學術產品,在結構上提供了三層信息底盤:搜索負責廣覆蓋和實時信息,百科提供結構化的實體與概念關系,學術檢索則對應更高權威度的專業(yè)內容。
對于復雜任務來說,高質量的信息渠道和知識庫,對真實工作流中的Agent能力尤為重要。
而對于C端用戶而言,搜索門戶正在成為AI能力分發(fā)的重要入口。用戶在搜索中表達需求,往往不是為了聊天,而是為了“查、選、比、辦”,解決生活中的真實問題。
這也正是百度在自身業(yè)務體系中的天然優(yōu)勢:把海量信息整理為可查詢、可調用的結構化資源。當這些能力被封裝為Skill接口后,Agent就可以像調用工具一樣調用搜索和知識服務。
而在當前的ClawHub生態(tài)中,百度已經上線了一系列官方能力,包括百度搜索、百度百科、小度、百度一見等skills。其中,百度搜索Skill以超36300次的下載量,成為該平臺全球下載量第一的搜索引擎官方技能插件。這些Skill不僅為開發(fā)者提供穩(wěn)定的數據來源,也讓Agent在執(zhí)行復雜任務時能夠直接調用權威信息。
所以,百度在Agent生態(tài)中的獨特之處,恰恰在于它同時具備兩項能力:一邊是全棧AI云平臺、模型調度和托管能力,另一邊是已經成體系的信息基礎設施和高頻入口。
如果說“讓龍蝦跑起來”,是各家云廠商或多或少都具備的能力,那么更進一步,在“讓龍蝦真正學會做事”的命題上,百度已經占據先機。
特別聲明:本文為合作媒體授權DoNews專欄轉載,文章版權歸原作者及原出處所有。文章系作者個人觀點,不代表DoNews專欄的立場,轉載請聯(lián)系原作者及原出處獲取授權。(有任何疑問都請聯(lián)系idonews@donews.com)