图片
图片
曾在亚马逊AWS负责GenAI相关核心研发,这位大佬解读了目前Agent的发展情况。
图片
@数科星球原创
作者丨苑晶
编辑丨大兔
当AI智能体从实验室Demo走向全民日常,一个极具画面感的景象正在全球科技圈蔓延:普通用户在本地部署专属AI Agent,圈内人戏称这是“养AI小龙虾”——每个人都有自己的“专属智能伙伴”,却只能困在个人设备的“玻璃缸”里,无法与其他“小龙虾”互通有无。
热潮之下,开发者忙着用LangGraph、AutoGen搭建封闭的Agent团队,试图通过固定分工实现高效协作;企业却在多智能体协同的“泥潭”中挣扎:延迟过高、协议不兼容、安全风控难落地、规模化部署遇瓶颈,看似热闹的赛道,实则暗藏诸多行业死结。
2026年,被行业公认为AI智能体规模化落地元年。
权威数据显示,全球AI Agent核心市场规模将突破187亿美元,同比增速高达215%,带动上下游经济规模超5000亿美元;中国市场规模将站稳480亿元关口,未来五年复合增速超50%。
从OpenAI推出Agent Mode,到Claude code聚焦编程场景,再到OpenClaw让本地个人智能体彻底破圈,AI智能体正以指数级速度渗透个人、开发者、企业三大圈层。
图片
但喧嚣的赛道背后,行业的本质矛盾愈发尖锐,形成四大难以调和的对立:
-
一边是单Agent能力持续进化,GPT-4、Claude4等大模型加持下,单个智能体的感知、决策、执行能力不断突破;一边是Agent之间“孤岛化”严重,不同框架、不同平台的智能体无法互联互通,如同操着不同语言的人,只能隔空相望。
-
一边是MCP、A2A等协议争相制定行业标准(MCP由Anthropic推动、侧重工具调用,已迭代8个协议版本并捐赠给Linux Foundation;A2A由Google推动、定义智能体地址声明与通信规则,侧重Agent to Agent交互,已迭代7个版本);一边是协议割据、硬件适配性差、跨框架协作无解,两大主流协议各有局限,均未对“智能体网络”做出明确定义,仅聚焦单个智能体的通信规则。
-
一边是个人Agent遍地开花,普通人可轻松部署写作、编程、生活助手类智能体;一边是企业级超大规模Agent网络缺乏低延迟、高稳定、可扩展的底层支撑,千人级以上企业的分布式办公场景,始终无法实现海量Agent的高效协同。
-
一边是开源社区蓬勃生长,开发者热情高涨,不断推出新的Agent框架与工具;一边是商业化落地与安全防护难以平衡,智能体联网带来的劫持风险、数据泄露问题,成为制约行业发展的“绊脚石”。
当全行业都在内卷“如何打造更强的单个Agent”时,有一个开源社区走出了反常识的破局路径——OpenAgents。
这家由前亚马逊AWS GenAI资深科学家领衔的技术团队,放弃追逐单Agent能力的风口,死磕智能体互联的底层技术,推出全球首个面向大规模连接的开放式智能体网络框架,以ONM(OpenAgents Network Model)为核心协议,兼容多协议生态,打造「去封闭、可扩展、无壁垒、科学化」的智能体互联网新品类。
在本地Agent、云端Agent、脑机Agent扎堆的市场中,OpenAgents以“百万级并发协作、低延迟通信、跨协议兼容、社区驱动”的核心优势,成为全球开发者、中大型企业、AI研究者的关注焦点。
这不是一场追逐风口的投机创业,而是一位深耕多智能体、自然语言生成十余年的科学家,基于学科底色、行业痛点、用户需求做出的理性选择。
本次,数科星球DigitalPlanet深度对话OpenAgents创始人Raphael Shu,他于2020年拿到东京大学计算机科学博士学位,曾在亚马逊AWS负责GenAI相关核心研发,深耕多智能体协同与自然语言生成领域十余年。
本文旨在还原OpenAgents从0到1的研发逻辑、技术壁垒、产品矩阵、商业布局与行业思考,揭开「智能体互联网」赛道的硬核真相。
>官网:openagents.org<
01
人人养“小龙虾”,却活在信息孤岛
数科星球DigitalPlanet观察到,AI产业的范式跃迁,始终围绕“从被动响应到主动执行,从单一能力到协同协作”的核心逻辑演进。
图片
早期AI以对话式Chatbot为主,仅能完成简单的问答交互,属于“指令—响应”的初级形态;大模型时代到来后,AI Agent应运而生,具备自主感知、分析决策、执行闭环的核心能力,能独立完成复杂任务,成为大模型商业化落地的核心载体。
2025年至今,AI Agent赛道完成三次关键跃迁,每一次跃迁都推动行业向更高效、更智能的方向迈进:
首先是单Agent时代,这个时代聚焦单个智能体的能力优化,如编程Agent、写作Agent、客服Agent,核心解决单一垂直场景的效率问题,比如用编程Agent自动生成代码、用客服Agent处理简单咨询,本质上是“单点效率提升”。
很快,行业演进到了封闭多Agent时代:即以LangGraph、AutoGen、CrewAI为代表,搭建固定工作流的Agent团队,适用于流程化、标准化的企业任务,比如让“需求分析Agent+编程Agent+测试Agent”形成固定协作流程,完成简单的软件开发任务,本质上是“小范围协同”。
今天,这个领域正式升级为开放智能体时代,核心特征是海量动态Agent实时在线、自主协作,打破框架、协议、平台的边界,实现真正的智能体互联。
微软在Build2025大会上明确提出Open Agentic Web愿景,宣告AI行业正式进入“智能体互联网”时代——让AI智能体像互联网中的网页一样,自由连接、自主运作、全球协同。但理想与现实之间,横亘着难以逾越的行业鸿沟。
最突出的痛点,就是智能体的“孤岛化”。
这些本地部署的Agent,大多孤立运行在个人设备上,缺乏统一的连接标准,无法实现跨设备、跨用户、跨场景的协作。
正如Raphael Shu在与数科星球DigitalPlanet对话中所言:“你有你的Agents,我有我的Agents,开发与营销的机器人需要协作,却只能通过人作为中介传递信息,完全违背AI原生的核心逻辑——自主协作、解放人力。”
其次是协议割据带来的协作壁垒。
为解决智能体通信问题,行业推出多个协议标准,但均存在天然缺陷:MCP仅适用于工具调用场景,无法支撑大规模协同;A2A 基于 HTTP + JSON-RPC 协议,早期版本在高频实时交互场景中存在一定延迟开销(通常在数百毫秒级别);虽然后续版本已引入gRPC 支持和传输优化,但在智能驾驶等毫秒级低延迟场景中仍有局限。
更值得注意的是,Oracle 推出的 Open Agent Specification(Agent Spec)是一种框架无关的声明式语言,旨在用统一格式描述 Agent 的结构与行为,解决跨框架的可移植性与可复用性问题。它定义了 Agent 是什么、能做什么,但未涉及智能体网络层面的寻址、路由、事件分发等运行规则。
第三,封闭工作流无法适配动态场景,企业级协作难以为继。
当前主流多Agent框架均采用封闭工作流模式:即固定3-4个Agent,一旦某个Agent下线,整个工作流直接瘫痪。
这种模式仅适用于服务器查错、流程化办公等固定任务,无法适配企业海量动态Agent的协同需求。
对于拥有上千名员工、全球分布式办公的企业而言,员工的本地Agent实时生成报告、处理任务,企业需要快速检索、协同这些Agent的上下文信息,封闭工作流完全无法满足这种“高动态、高扩展、高效率”的需求。
最后,安全风险成为行业不可承受之重。
本地智能体普遍需要联网获取信息,而联网带来了致命的安全隐患:恶意网页可通过摘要植入恶意指令,劫持智能体权限;智能体接触敏感信息后,可能通过联网泄露数据;更令人担忧的是,行业对智能体安全的认知与研究,远滞后于技术普及速度。
Raphael Shu对数科星球DigitalPlanet坦言:“智能体劫持是当前行业最难规避的问题,一旦允许智能体联网,就会产生大量不可控性,而断开联网,智能体的价值又会大幅缩水,这是一个无法调和的矛盾。”
数科星球DigitalPlanet认为,AI智能体赛道的终局,不是比拼单个智能体的能力强弱,而是搭建让所有智能体自由连接、高效协作的底层网络。
正如TCP/IP协议奠定了互联网的基础,智能体时代需要一套全新的底层协议,定义智能体的发现、通信、协作、寻址规则,打破孤岛、协议、场景的边界。
而OpenAgents,正是这场行业变革的先行者。
02
真正的智能体Web协议
2025年,Raphael Shu正式创立OpenAgents,该公司从成立起便确立了核心方向:即以开源社区为基础,以开放式智能体网络为核心,打造兼容多协议、支持百万级并发、低延迟协作的智能体互联网底层框架,让全球所有AI Agent都能自由连接、高效协作。
与纯开源或纯商业化项目不同,OpenAgents采用“开源社区+企业级商业化”的双轨模式,这也是其区别于行业竞品的核心特征——既保持开源的开放性与创新活力,又通过商业化实现可持续发展,形成良性循环。
OpenAgents开源社区面向全球开发者,免费开放核心协议、SDK、工具链,汇聚全球力量共建智能体网络;而Acenta AI作为商业化产品线,聚焦中大型企业客户,提供超大规模、超高速、高稳定的智能体网络解决方案,实现可持续现金流。
“开源社区负责探索边界、验证场景,商业化产品线负责落地交付、保障稳定,两者互补,而非竞争。”Raphael Shu对数科星球DigitalPlanet表示。
OpenAgents Network Model(ONM)是OpenAgents的技术核心,这是全球首个针对开放式智能体网络的标准化协议,也是其打破行业困局的关键。不同于MCP、A2A仅聚焦单个Agent的通信规则,也区别于Oracle Agent Spec侧重Agent的可移植性,ONM的核心设计理念,是解决智能体网络的三大底层问题,构建真正的“智能体Web协议”。
第一,网络边界定义:明确智能体网络的地址、成员、资源规则,让Agent可快速找到目标网络,就像互联网中的域名系统,让设备能够快速定位目标服务器。
第二,智能体寻址规则:定义网络内智能体的唯一地址,实现精准发现与通信,避免地址冲突,确保不同框架、不同平台的Agent能够“精准对话”。
第三,资源定位标准:为智能体生成的报告、文件、数据等资源分配专属地址,实现跨Agent共享,打破资源孤岛。
“A2A协议仅定义了两个Agent之间的任务传递,而ONM定义了整个智能体网络的运行规则。如果说A2A是局域网协议,那么ONM就是真正的智能体Web协议。”Raphael Shu对数科星球DigitalPlanet解释道。
更重要的是,ONM并非要取代现有协议,而是实现兼容整合,目前已支持包括A2A、MCP在内的五大主流协议,同时与OracleAgentSpec形成生态互补,让开发者可自主选择需要兼容的协议,无需重复开发,跳出了协议混战的泥潭,成为连接所有智能体框架的“中间层”。
03
开放动态网络的范式跃迁
除了ONM协议,OpenAgents的核心竞争力,还在于其统一事件驱动的分层模块化架构,以及由此带来的百万级并发支撑、低延迟协作能力,这也是其与封闭多Agent框架的本质区别。
OpenAgents采用统一事件驱动的分层模块化架构,所有通信均通过单一事件系统流转,具备极致的灵活性、可扩展性与稳定性,核心包含三大特性:
一是统一事件系统,所有交互均建模为“事件”,采用层级化命名(如agent.message、project.run.completed),支持灵活寻址与通配符订阅,实现Agent、模组、通道、系统之间的无缝通信,无论Agent来自哪个框架、哪个平台,都能通过事件系统实现高效交互。
二是三层模组防护体系,这也是其安全能力的核心:拦截模组主动拦截消息,支持加密、权限校验等操作,从源头管控风险;防御模组7×24小时监听网络内的恶意消息,实时拦截风险行为,防止劫持扩散;记忆/存储模组持久化存储消息、数据,支持溯源与审计,为企业合规提供支撑。
三是百万级并发支撑,通过优化资源分配、分布式处理、智能负载均衡,Open Agents可支持数百万级并发Agent持续协作;商业化产品线Acenta AI,更是将协作延迟从数百毫秒降至几十毫秒甚至十几毫秒,满足金融、工业、实时协作等严苛场景的低延迟需求。
当前,LangGraph、AutoGen、CrewAI等主流框架,均聚焦“如何打造最强的单个Agent或Agent团队”,这已经成为行业的普遍误区。
这类框架的核心逻辑,是帮助开发者搭建固定分工的Agent团队,如同组建一支“篮球队”,每个Agent有固定位置、固定任务,适用于开发、设计、运营等流程化协作场景。
但这种模式的局限性显而易见:仅适用于小范围、固定流程的协作,无法适配海量动态Agent的大规模协同。
比如,当企业需要新增一个“数据分析Agent”加入协作时,需要重新调整整个工作流,操作繁琐且效率低下;当部分Agent下线时,整个协作流程会直接中断,无法实现稳定运行。
OpenAgents与主流框架的本质差异,可用一句话概括:LangGraph们在造最强的篮球队,OpenAgents在建最大的篮球馆。
图片
OpenAgents不直接打造单个Agent,而是提供智能体网络的底层基础设施,让所有框架开发的Agent都能进入网络,自由连接、自主协作——无论你是AutoGen开发的Agent,还是LangGraph搭建的Agent团队,都能在Open Agents网络中找到合作伙伴,实现能力互补。
目前,OpenAgents已与AutoGen达成深度合作,成为官方合作伙伴,实现生态互补;同时与LangChain、CrewAI等主流框架完成兼容对接,进一步扩大生态影响力。
“我们的使命不是替代现有Agent框架,而是让所有框架的Agent都能实现1+1>2的协作效果。”Raphael Shu对数科星球DigitalPlanet表示,这种定位让OpenAgents避开了同质化竞争,成为全行业的“基础设施提供商”,也让其能够汇聚全球生态力量,加速智能体互联网的落地。
无OpenAgents时,需人工传递测试结果、修复指令,流程繁琐、易出错,一个跨平台测试周期往往需要数天;接入OpenAgents后,开发Agent自动推送更新包,各平台测试Agent自主检测、反馈问题,修复Agent实时优化,全程无需人工干预,效率提升10倍以上,测试周期缩短至数小时。
今年4月刚上线的OpenAgents Workspace,是OpenAgents生态的“流量入口”,核心目标是降低用户使用门槛,让普通人也能轻松管理和使用智能体网络。
其核心特性包括:
-
一是多Agent集成,上线即支持多种主流Agent(OpenClaw、Claude Code、Codex、Cursor、OpenCode等),并联合十余家头部Agent厂商发布,覆盖写作、编程、生活、办公等多个场景;
-
二是可视化操作,提供Workspace 可视化Web界面,开发者3分钟就能完成初步Demo,普通人无需编程基础,也能轻松上手;
-
三是核心价值,帮助用户轻松管理本地
Agent,将Agent接入开放网络,实现跨Agent自主协作,无需人工切换工具,提升个人与团队生产力;
-
四是定位,成为全球用户一站式智能体管理与协作平台,打通本地、云端、企业级Agent的连接壁垒,实现全场景覆盖。
目前,OpenAgents主要有以下几个项目:Network SDK(Python SDK)是标准化开发工具, OpenAgents 最早的项目,支持快速集成、二次开发,适合开发者使用,门槛较高;OpenAgents Workspace (新版本)更适合想快速上手多Agent协作的普通用户,workspace是最终呈现的浏览器页面,可在上面快速搭建简易智能体协作场景。
Launcher则是根据不同系统适配的轻量级安装包,高效便捷,方便本地部署。
未来,当智能体互联网像今天的互联网一样普及,当所有AI Agent都能自由连接、自主协作,当智能体真正成为赋能各行各业的基础设施,我们会记得:在2026年的智能体爆发期,有一个开源社区,用开放与坚守,搭建了通往未来的第一座桥梁。
而这场由OpenAgents引领的变革,也将重新定义AI的未来,开启一个全新的智能时代。
精彩评论