声网公司
声网公司官方号
老虎认证: 声网成立于2014年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。
IP属地:上海
12关注
15210粉丝
声网成立于2014年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。
avatar声网公司
2024-02-28

声网母公司发布2023 Q4及全年财报,实现3年来首次盈利

北京时间2月27日,声网母公司 Agora, Inc.(NASDAQ: API) 公布了2023年第四季度及全年财报。财报显示,第四季度 Agora, Inc. 实现营收3604万美元,环比增长3%,全年总营收1.42亿美元。 其中,业务聚焦中国市场的声网第四季度实现营收1.48亿人民币,环比增长5%;聚焦非中国市场的 Agora 第四季度实现营收1530万美元,环比持平。 值得一提的是,得益于多元实时互动应用场景的增长和行业扩展,Agora, Inc. 2023年第四季度调整后净利润为140万美元,实现三年以来首次季度盈利。 对此,Agora, Inc.创始人兼CEO赵斌表示,“我们在2023年四季度取得了强劲的财务业绩,实现了连续的收入环比增长,并实现了140万美元调整后净利润,这是三年以来首次季度盈利。这反映了我们在极具挑战的经营环境下的业务韧性,以及我们不断优化成本结构的努力。” Agora, Inc.在2023年第四季度完成股票回购350万ADS,总金额1000万美元。赵斌表示,“在过去的两年中,我们通过回购方式向股东返还了超过1亿美元,我们的总股本也相应降低了约18%。我们非常高兴地宣布,董事会已经授权将2亿美元的股份回购计划延长12个月,这体现了董事会对我们的财务实力和长期增长前景的信心。” 在客户规模方面,截至2023年12月31日,声网活跃客户数量达4144个,同比增长12%,Agora活跃客户数量达1683个,同比增长18%。
声网母公司发布2023 Q4及全年财报,实现3年来首次盈利

深耕出海与产品创新,声网斩获三项行业奖项

近日,声网在出海与产品、技术领域收获多项行业认可: 🏆声网荣获 InfoQ 2025年度「优秀出海服务商奖」 作为国内极具影响力的技术社区,InfoQ 评选聚焦企业技术实践与全球化布局。声网凭借长期深耕海外市场,以低延时、强降噪等 RTC 核心能力,赋能跨境电商、社交互动、在线教育等场景,助力企业打破地域壁垒,斩获该奖。 🏆声网对话式 AI 引擎获评2025 AI 产品大会「年度影响力 AI 产品」 该奖项由「人人都是产品经理」与腾讯大讲堂联合颁发,评审聚焦产品应用价值与行业带动作用。声网对话式 AI 引擎以轻量化部署、高适配性优势入选,可快速对接企业业务体系,落地 AI 硬件、AI 教育等多元场景,高效解决开发痛点。 🏆声网对话式 AI 引擎摘得大模型之家2025达摩奖「年度 AI 杰出创新成果」 该奖项关注行业关键技术突破,声网对话式 AI 引擎因底层技术创新获奖。引擎兼容全球主流大模型与语音合成技术,支持声纹识别、跨场景拓展,适配智能外呼、情感陪伴等复杂需求,赋能产业智能化升级。 每份荣誉都离不开行业与客户的信任。未来,声网将坚守技术初心,深耕实时互动与对话式 AI 领域,以更扎实的技术与服务,携手伙伴推动行业高质量发展。
深耕出海与产品创新,声网斩获三项行业奖项

芙崽、陆卡卡、糯宝、小匠物联,这些 AI 硬件都在用声网对话式 AI

🎊 CES 2026已经落幕,来自中国的各类创新 AI 硬件与具身机器人成为了本次 CES 的焦点,其中,Fuzozo 芙崽、陆卡卡、糯宝、Lookee 口语侠等 AI硬件凭借出色的对话交互体验,现场受到很多参会人群关注,一起来看看,这些 AI 硬件是如何利用声网对话式 AI 技术,来打造极致人机交互体验的吧! 🐻 AI 陪伴机器人 - Fuzozo 芙崽 借助声网的对话式 AI 能力,珞博旗下的口袋 Al 毛绒宠物 Fuzozo 大幅优化了 AI 交互的实时性和稳定性,使得这款 AI陪伴机器人能够进行自然流畅的对话,提供实时情感陪伴和个性化交互,从而为用户带来全新的陪伴体验。 🤖 桌面级情感陪伴机器人 - 陆卡卡 陆卡卡搭载了声网全新的 R2全场景 AI 机器人开发套件,该套件将复杂的本地视觉、运动控制与实时语音交互深度融合并封装为标准化模块,显著降低了开发门槛,使得陆吾将资源更聚焦于产品创新与体验打磨。 👨🏫 口袋 AI 外教 - Lookee 借助声网的对话式 AI 技术, Lookee 构建起稳定、低延迟且清晰的高质量对话环境,确保了每一次问答与情景对话都能如真人交流般自然流畅、即时响应,这为产品实现深度的引导式对话与沉浸式陪伴体验提供了可靠的技术基础。 🧸 AI陪伴机器人 - 糯宝 在声网对话式 AI 技术的助力下,糯宝的“活人感”进一步升级,不仅可以与人类进行自然、流畅的对话,还能准确识别用户的情绪并快速给予相应的反馈,成为贴心的情感陪伴者。同时,它还支持声纹识别与多人对话识别,不仅能在嘈杂环境中准确分辨交流对象,还能流畅应对多位用户的交流互动。 👓 对话式 AI 眼镜 - HeyCyan 在办公场景中,HeyCyan 可高效生成会议纪要,结合声网深度优化的对话式 AI 技术,实现“所问即所答”的即时反馈。配合新一代语音合成,AI 音色自然生动,听觉体验真实流畅
芙崽、陆卡卡、糯宝、小匠物联,这些 AI 硬件都在用声网对话式 AI

开年重磅丨声网与 MiniMax 深化全球战略合作

近期,MiniMax 在港交所成功上市,其与声网也进一步深化了战略合作关系。MiniMax 将领先的文本转语音(TTS)技术及多模态大模型,与声网对话式 AI 引擎以及全球超低延时实时传输网络(SD-RTN™)相结合。这一强强联手将助力全球开发者与企业,部署更具生命力、响应更灵敏、体验更拟人化的对话式 AI 产品。 早在2024年10月,声网就宣布与 MiniMax 联手发布国内首个 Realtime API,助力 AI 告别“机械感”,实现更低延时的自然交流。 从模型能力走向真实世界的交互 随着生成式 AI 的飞速发展,行业真正的挑战在于如何将高质量的 AI 转化为跨设备、跨复杂网络环境的自然实时交互体验。 MiniMax 的 TTS 模型具备表达丰富、可控且情感细腻的语音生成能力,支持多种语言、语调和说话风格。而声网则提供了互补的核心优势:将 AI 输出转化为实时交互体验,这使得 AI 的表现更贴近人类的沟通模式。 此次合作的独特之处不仅在于技术层面的集成,更在于双方全球化的视野: MiniMax 带来具备全球视野的前沿 AI 模型:其模型在设计之初就针对多语言、多文化及内容丰富的应用场景进行了优化。 声网提供经受过实战检验的全球实时网络:其自建的 SD-RTN™  网络覆盖 200 多个国家和地区,旨在提供毫秒级的超低延时、优秀的抖动控制以及大规模并发下的音视频质量保证。 双方共同填补了 AI 生态系统中的关键空白:即无论用户身处何地、使用何种设备,都能获得稳定、自然且富有表现力的 AI 语音交互体验 。 赋能下一代实时语音 AI 产品 声网与 MiniMax 的联合解决方案已在多个场景中落地,包括: · AI 陪伴与智能设备:需要实时语音反馈的交互场景  · 实时语音 Agents:用于客服和企业工作流的自动化交互 
开年重磅丨声网与 MiniMax 深化全球战略合作

CES 爆火!这款全球最小的 AI 教育产品,把“学习”设计成了“渴望”

在 CES 2026 现场,一款精致可爱的 AI 硬件旁始终围满体验者——这正是盒智科技新发布的 Lookee 口语侠。短短时间,这份业内的高度关注已悄然流入许多家庭的年货清单。它回应的不仅是教育开发者的思考,更是家长心底的柔软期待:能否让孩子自然而然地爱上说英语,让学习成为渴望陪伴时的自然发生? Lookee  亮相 CES 2026 声网展位 这份期待,指向了两个久未解决的教育痛点:“哑巴英语”的无效学习,与智能硬件常见的“迅速闲置”。Lookee 与背后提供 RTC 技术的声网,正在合力给出一个温暖的答案。 破解“哑巴英语”困局: 从“屏幕依赖”回归“真实对话” 中国孩子学习英语普遍面临“哑巴英语”的挑战。研究表明,当学习同时依赖屏幕文字和声音时,大脑会优先处理视觉信息,从而抑制听觉与口语表达能力的提升,这是导致很多孩子“能读不能说”现象的重要根源。 因此,盒智科技没有选择在屏幕上堆叠更丰富的多媒体内容,而是做出了一个反直觉的关键产品定义:彻底移除屏幕,让交互回归纯粹。这背后,是对真实语言交流环境的彻底模拟。 于是,我们看到了 Lookee 口语侠:外形轻巧如耳机盒,重量不足50克,支持独立 4G 联网。它生来就是为了被装进口袋,挂在胸前,陪伴在沙发、车内或公园长椅上——在任何孩子觉得放松的时刻,开启一场轻松的对话。这或许正是当下许多家庭所寻求的:一种不侵占孩子视力、不制造亲子摩擦、随时随地融入生活的学习方式。 然而,实现“无屏沉浸式对话”这一理念,首要前提是必须拥有堪比真人对话的实时语音交互质量。任何卡顿、延迟或杂音,都会打断孩子的表达思路与沉浸感。这正是声网技术发挥关键作用的地方: 通过自研的 SD-RTN™ 网络与高清晰、抗弱网、强降噪的音频解决方案,确保了孩子无论身处移动环境还是网络不稳的场景,与 Lookee 的对话都能始终保持清晰、流畅、稳定。
CES 爆火!这款全球最小的 AI 教育产品,把“学习”设计成了“渴望”

CES 2026丨声网联合博通集成发布 R2 全场景 AI 机器人开发套件

CES 2026 期间,声网联合中国领先的无线连接芯片设计企业博通集成正式发布基于 BK7259 芯片的“ R2 全场景 AI 机器人开发套件”。陆吾智能旗下“陆卡卡”作为该方案在桌面机器人场景的标杆产品,同步亮相展会。 陆卡卡在 CES 声网兄弟公司 Agora 展位 R1 到 R2 的升级: 从“能听会说”迈向“能看会动” 去年3月,声网 R1 开发套件一经发布,珞博智能的“芙崽Fuzozo”便成为声网首批客户。 在京东2025年6·18大促期间, Fuzozo 在 AI 玩具竞速榜中表现亮眼,旗下“金木水火土”五个款式占据当天竞速榜前六位。市场对 Fuzozo 的广泛认可,验证了 R1 套件出色的实力与市场潜力。 芙崽在 CES 声网兄弟公司 Agora 展位 本次推出的 R2 套件则是在 R1 基础上的技术、功能升级,并标志着声网端侧 AI 交互能力从“能听会说”到“能看会动”的正式跨越。 R2 完整继承了 R1 系列业界领先的全双工对话、背景降噪、流畅打断等实时 AI 语音交互能力。并新增以下突破性功能: 本地视觉识别与处理能力: 依托 BK7259 芯片强大的集成 NPU 与 ISP,R2 新增本地视觉识别与处理能力。这意味着机器人可以实现人脸跟踪、手势识别、物体跟随等复杂功能,让实时交互从“语音”扩展到“视觉”。 实现具身互动,让机器人更具“活人感”: R2 支持多自由度运动控制,结合视觉与语音功能,助力机器人实现“走到用户面前打招呼”、“转头注视说话者”等富有生命感的情感化肢体交互。 诸多合作伙伴产品联合参展: 陆卡卡、Lookee、Choochoo 、小匠、二白机器人等在现场 定义“全场景”: 一套基座,赋能多元硬件创新 R2 的能力边界不止于桌面机器人。其设计初衷是为需要融合“感知-决策-动作”的 AI 硬件提供标准化参考,为各类创新硬件提供一套经过验证
CES 2026丨声网联合博通集成发布 R2 全场景 AI 机器人开发套件

CES 2026 首发丨声网开源 AOSL ,构建 AI 硬件开放新生态

CES 2026 展会期间,声网宣布将其核心的硬件抽象层项目 AOSL (高级操作系统层)在 GitHub 全面开源。  图片 AOSL 能显著降低 AI 在硬件端落地的创新门槛,加速催生更繁荣的硬件创新生态。芯片原厂和设备开发者可以更便捷、快速地集成 Voice AI 等能力,推动产品化进程,从“一次性定制”走向“可复用、可扩展”的生态协作。 定义标准接口 消除适配碎片化 AOSL 是一个由声网发起并完全开源的标准项目,已在 GitHub 开放共享。 它通过定义操作系统、芯片与 RTC 传输层之间的通用接口,有效屏蔽了不同芯片和操作系统之间的底层差异,让开发者能够专注于应用层创新,而无需适配复杂的硬件与系统碎片化问题,尤其为 RTOS 等嵌入式场景提供了统一支持。 图片 这意味着,芯片厂商或硬件开发者可以依据这套标准接口,高效完成自身平台的驱动对接,从而大幅降低技术门槛、缩短周期并提升稳定性。 为了确保这一过程的可靠与高效,项目同步开源了经过设备验证的参考实现(支持 FreeRTOS 的 BK7258 和 ESP32 S3 及通用 Linux)以及一套完备的自动化测试用例。这使得任何新平台的实现都能在真正调试前验证其性能与稳定性,为生态协作提供了坚实的技术基准。 赋能芯片生态 加速 AI 硬件产品落地 AOSL 以开源开放的模式,显著降低了 AI 在硬件端落地的创新门槛,加速催生更繁荣的硬件创新生态。它帮助芯片原厂和设备开发者更便捷、快速地集成 Voice AI 等能力,推动产品化进程,从“一次性定制”走向“可复用、可扩展”的生态协作。 对于芯片厂商,实现与 AOSL 的对接并进入声网的“官方认证”矩阵,意味着其芯片能直接附加强大的“出厂即智能”属性,成为开拓市场的利器,并形成一个“芯片增强竞争力-吸引更多开发者-生态繁荣反哺芯片”的增强回路
CES 2026 首发丨声网开源 AOSL ,构建 AI 硬件开放新生态

从 “活人感” 缺失到体验基准打造:对话式智能体的进化之路

2024年的夏天,一场关于 WebRTC 与生成式 AI 的 PPT 任务,开启了45天的疯狂冲刺,最终诞生了第一款 To B 的 Realtime API 。这段经历不仅颠覆了对硅谷工作文化的认知,更揭示了 AI 时代产品开发的残酷法则:速度、稳定性和实验精神。本文将深入探讨对话式 AI 的生死线、技术路线选择背后的战略思考,以及在技术狂飙中如何保持人性的深刻洞察。 前段时间的2025 AI 产品大会中,声网 AI 产品线负责人姚光华认为,下一代AI助手必须具备“人格化”特征。 通过情感识别、多轮对话记忆,现代 AI 正在获得接近真人的“活人感”。但他同时强调,必须建立统一的体验基准,让这种“人味儿”质量可控、体验可预期。本文为姚光华现场分享精华内容,分享给大家: 2024年的夏天,上海热得反常,据说是90年来最热的一个夏天。 八月的一天中午,老板的电话来了。“ Colin,停下你手头所有的事,”他在电话那头说,“帮我写一个 PPT 。” 没有解释,只有紧迫。我推掉了下午和晚上所有的安排。那个通宵,我只写了三页 PPT :关于通信协议的三次迭代,关于开源 WebRTC 与商业 RTC 的系统性比较,以及一张产品架构大图——关于如何让一个大模型开始“说话”。 凌晨五点,会议结束,我回到家。这并非终点,而是接下来45天疯狂加班的起点。那45天的极限冲刺,换来的是国庆长假第一天,我们与 OpenAI 共同面向世界推出了第一款 To B 的 Realtime API。从那天起,开发者终于可以在自己的应用里,真正接上对话式智能体。 这次经历留给我最深的印记,不是技术参数,而是一种认知的崩塌与重建。站在2025年的路口,我意识到:地球是圆的,硅谷也可以是卷的。 01 硅谷没有“松弛感” 如果你在工作的强度上有 K 线图,会发现一个惊人的事实:所有 AI 时代的产品和研发,在2024年
从 “活人感” 缺失到体验基准打造:对话式智能体的进化之路
avatar声网公司
2025-12-24

声网×珞博智能斩获 OFweek 2025物联网行业优秀成功应用案例奖

近日,声网与珞博智能共同申报的“珞博 AI 陪伴宠物 Fuzozo(芙崽)”项目,荣获“维科杯· OFweek 2025物联网行业优秀成功应用案例奖”。该奖项在物联网领域以高度专业性与行业影响力著称,旨在表彰当年具备创新价值与落地成效的卓越案例。 获奖背后,是项目所依托的坚实技术基础。声网为 Fuzozo 提供对话式 AI 引擎,通过低延迟、高稳定的实时互动技术实现自然流畅的情感交互。 Fuzozo 在 MWC 、 AWE 获认可,"618"首轮预售10分钟破千单。声网底层技术支撑成为 AI 伴侣机器人规模化应用的关键基础设施。 此次获奖,不仅是对珞博智能产品创新与市场表现的认可,也印证了声网对话式 AI 赋能合作伙伴、携手推动行业进步的模式取得了积极成效。 在 AI 陪伴型产品的研发中,情感陪伴功能的实现高度依赖于实时、稳定且拟人化的交互体验。这类产品的核心,往往在于能否在对话中给予用户如真人般自然流畅的回应——这正是声网为“芙崽”所提供的技术内核。在该赛道,实时互动已不再是“加分项”,而是决定产品温度与用户黏性的“生命线”。一旦出现响应延迟或交互中断,陪伴感便极易被打断,情感连接也难以维系。 声网为这种用户核心体验提供了全面而深入的技术支持。在软件层面,声网提供了对话式 AI 开发套件,其中的智能打断处理技术赋予了芙崽灵活的对话能力,能够根据用户的表达实时调整,极大地提升了交互的适应性与流畅度,告别机械式应答。 在硬件适配与性能调优方面,声网团队基于在对话式 AI 与硬件生态领域的积累,与珞博智能在芯片选型参考、功耗优化设计及外设功能协同等环节紧密协作,确保对话式 AI 在硬件平台上稳定、高效运行,为用户提供一致且可靠的体验。 此次获奖是双方合作成果再次获得的行业肯定。早在今年6月,该案例就在爱分析举办的第三届 AI 大模型高峰论坛上获评“ AI  Agent
声网×珞博智能斩获 OFweek 2025物联网行业优秀成功应用案例奖
avatar声网公司
2025-12-18

声网视频 SDK 首批通过 GIIC 鸿蒙生态权威评测,获「 Harmony Trusted SDK 」标识认证

近日,为进一步推动行业规范化发展,鸿蒙生态服务公司作为全球智慧物联网联盟( GIIC )授权测试机构,与中国信息通信研究院标准所共同完成了首批“鸿蒙 SDK 用户权益保护与个人信息收集评测”。声网视频 SDK 凭借扎实的合规架构设计与卓越的安全隐私保护能力,在众多产品中脱颖而出,首批通过权威测评,获得「 Harmony Trusted SDK 」认证。  证书 此次评测不仅是鸿蒙生态对 SDK 产品安全与合规的“硬核大考”,作为首个聚焦“物联网+鸿蒙”的国际化产业组织,GIIC 的此次认证也为鸿蒙 SDK 生态建立了规范化标杆,更为行业筛选安全、可信、合规的软件开发工具包( SDK )提供了依据。 该认证是对声网在数据安全与隐私保护领域多年的技术积累和实践的高度认可,标志着声网视频 SDK 在“用户权益保护”与“个人信息收集”两大核心维度上完全符合 GIIC 的高标准要求,也为广大鸿蒙应用开发者提供了合规与安心的实时音视频 SDK 选择,大幅降低开发者应用上架鸿蒙应用市场的合规风险,缩短开发周期,使开发者能更专注于业务创新。 作为鸿蒙生态的重要合作伙伴,声网近年来持续领跑鸿蒙生态适配进程:2024年1月,率先完成对鸿蒙 HarmonyOS NEXT 系统的适配,并支持 1V1 音视频场景,也是业内首批适配鸿蒙 HarmonyOS NEXT 系统版本的实时音视频服务厂商;6月,紧跟系统迭代节奏,率先完成基于鸿蒙 HarmonyOS NEXT Beta 版的实时音视频 SDK 适配;10月,推出实时音视频 SDK 4.4.0 适配版本,进一步提升音视频的基础能力和性能体验;同年12月,受邀参加“同心聚力,共建共享鸿蒙新生态”为主题
声网视频 SDK 首批通过 GIIC 鸿蒙生态权威评测,获「 Harmony Trusted SDK 」标识认证
avatar声网公司
2025-12-11

声网联合中国信通院牵头发布实时音视频类 SDK 安全标准

近年来,工业和信息化部大力推动提升移动互联网应用服务质量,构建 App 与 SDK 全链条、闭环式管理体系。通过建立个人信息保护“双清单”、细化 SDK 服务运营规范、开展多批次侵害用户权益专项整治等系列举措,不断压实企业主体责任,切实筑牢用户合法权益保障防线。2025年3月,中央网信办、工业和信息化部、公安部、市场监管总局联合启动个人信息保护系列专项行动,将 SDK 违法违规收集使用个人信息列为重点治理环节,进一步强化行业合规监管力度,推动 SDK 安全治理向纵深发展。 为积极响应国家监管部门对 SDK 安全管理的系列要求,破解实时音视频领域个人信息保护与用户权益保障的行业痛点。近日,由声网与中国信息通信研究院(以下简称“中国信通院”)联合牵头、实时互动领域代表企业共同参与编制的《T/TAF 267.6—2025 软件开发工具包(SDK)用户权益和个人信息保护技术要求 第6部分:实时音视频类》团体标准,正式在电信终端产业协会 TAF 发布。 图片 该标准立足实时音视频 SDK 技术特点与应用场景,聚焦个人信息保护核心合规需求,明确了个人信息收集、存储、使用、传输、销毁等全生命周期处理要求,细化了用户权益保护机制与业务功能划分配置规范,填补了实时音视频细分领域 SDK 安全标准的空白。标准的出台,不仅为行业企业提供了清晰、可操作的合规管理指引,助力企业规范 SDK 开发运营合规行为,也为监管部门开展监督检查、第三方评估机构实施合规评估提供了参考依据。此前,中国信通院已在 TAF 发布广告类、推送类、地图类、支付类、统计类等 SDK 相关标准,本次实时音视频类 SDK 标准的落地,标志着我
声网联合中国信通院牵头发布实时音视频类 SDK 安全标准
avatar声网公司
2025-12-11

声网对话式 AI Studio 零代码也能快速开发对话式 Agent

在对话式 AI 应用场景爆发的当下,开发门槛高、模型参数调优复杂、多供应商资源整合繁琐等行业痛点,成为了很多企业与开发者的烦恼。在 RTE2025 实时互联网大会上,声网正式发布了对话式 AI Studio 1.0,以 “零代码生产级智能体工厂” 为定位,直击行业痛点,凭借可视化编排、全流程模块化设计与生态化资源整合,让不懂代码、不熟悉音频参数的使用者也能在 1 小时内打造专属智能体,打破技术与效率的双重壁垒。 作为声网对话式 AI 全栈产品矩阵的重要一环,对话式 AI Studio 深度依托声网对话式 AI 引擎的技术底座,聚焦 “零门槛、高自由度、快上线运营” 的核心需求,构建起覆盖智能体编排、测试、部署、监控的全生命周期支持体系。其核心突破在于将复杂的技术转化为可视化操作:开发者可在一站式可视化界面中,轻松完成 Prompt 编写、ASR 与 TTS 模型选型、音色配置、数字人设置等全流程开发,无需关注底层技术细节。针对开发者普遍困扰的参数调试问题,平台提供预设推荐值与完整模板参数配置,开发者自己选择想用的功能和模块,就能做成自己要的对话式 Agent。 对话式 AI Studio 还为开发者提供了场景化模板与插件商店。场景化模板中心的场景选择兼具前瞻性与实用性,目前已上线智能客服、情感陪伴、英语陪练等热门场景模板,这些模板均源自对话式 AI 落地一年来经市场验证的高价值场景;后续还将逐步上线招聘专员、智能客服-电话外呼-服务满意度回访、智能助教-作业批改等更多细分场景模板,支持一键克隆快速启动项目。 插件商店则实现了第三方资源的一键选购与集成,涵盖国内主流 ASR、LLM、TTS 供应商资源,用户无需挨个注册账号,通过声网即可完成一键选购,高效组装。同时支持自有资源导入,满足个性化需求。平台与声网对话式 AI 模型评测平台深度联动,可根据延迟、成本等核心指
声网对话式 AI Studio 零代码也能快速开发对话式 Agent
avatar声网公司
2025-12-11

2025爱分析·对话式AI市场厂商评估:声网

01 公司介绍 声网成立于 2014 年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。开发者只需简单调用声网 API,即可在应用内构建诸如对话式 AI、音视频通话、直播等多种实时互动场景。 2020 年 6 月 26 日,声网母公司 Agora, Inc. 成功登陆纳斯达克,股票代码为“API”。 02 产品服务介绍 声网的核心产品体系已从基础的实时音视频(RTC)延伸至“对话式 AI”全栈矩阵。其核心产品为“对话式 AI 引擎”,该引擎支持与全球主流的大语言模型集成,提供低至 650ms 的端到端响应延迟和智能打断功能。 围绕该引擎,声网推出了“对话式 AI 开发套件”,针对智能硬件提供软硬一体化方案,支持主流芯片与多模态交互。 此外,声网还发布了“对话式 AI Studio”低代码编排平台和“AI 模型评测平台”,前者用于快速搭建和编排智能体,后者帮助开发者科学评估和选择 ASR、LLM 及 TTS 模型。底层基础设施方面,声网依赖其自研的全球软件定义实时网 SD-RTN™ 保障高并发下的网络传输质量。 03 厂商评估 作为实时互动云服务领域的头部厂商,声网在生成式 AI 浪潮中迅速完成了从“传输管道”提供商向“智能交互”基础设施服务商的转型。不同于从模型层切入的 AI 初创公司,声网的核心竞争力在于利用过去十余年在实时网络传输和音频处理上的工程化积累,解决了大模型落地过程中最为棘手的延迟控制、即时打断及复杂网络环境下的稳定性问题。 通过构建开放、中立的生态位,声网将 ASR、LLM、TTS 等碎片化能力通过引擎进行标准化封装,并辅以开发套件和评测工具,极大地降低了企业集成对话式 AI 的技术门槛与试错成本。 随着政策对 AI 产业落地的推动以及电话、网页、智能硬件等场景需求的规模化爆发,声网的产品矩阵已具备支撑大规模商业化应用的能力,特
2025爱分析·对话式AI市场厂商评估:声网
avatar声网公司
2025-12-11

对话式 AI 引擎2.0 让 AI 更懂开口时机 支持预注册声纹识别与电话外呼

在今年的 RTE2025 实时互联网大会上,声网正式发布了对话式 AI 引擎2.0版本,该版本实现“优雅打断”的升级,支持过滤无语义附和词,让 AI 更懂开口的时机;支持预注册声纹识别,AI 能分辨是谁在讲话;新增 AI 电话外呼功能,支持 SIP/PSTN 电话,通过 AI Studio 编排或一行代码即可实现,稳定性高。同时新版本还支持国内外更丰富的 ASR 与 TTS 供应商,用户可根据自己需求选择想要的语种和音色。 对话式 AI 引擎最新产品架构图 优雅打断2.0 让 AI 更懂开口时机 在人与人对话中,经常为了表示认同会发出“嗯”、“啊”、“是的”等常见的语义附和词,但在 AI 对话中,用户并不希望因为自己无意中的一些语义附和词,让 AI 提前响应,这样会给对话体验造成比较割裂的体验感,在教育、会议等很多场景也有很多词需要提前过滤,不需要被 AI 响应。 基于此,对话式 AI 引擎2.0版对“优雅打断”功能进行了升级,不仅支持过滤对话中无语义的附和词,自动识别“嗯”、“啊”等对话附和词,避免误触发响应,还可以过滤自定义的文本,以适应不同业务场景需求。  预注册声纹识别 让 AI 知道是谁在说话 在对话式 AI 中,多人同时与 AI 互动的场景将会越来越多。家居场景中,父母与孩子都会与 AI 互动,孩子不希望聊的内容被爸爸妈妈发现,所以希望 AI 能够区分自己与父母的身份,在和 AI 对话时可以产出不同的内容。 针对这样的需求,声网对话式 AI 引擎2.0 上线了预注册声纹识别,用户仅需4-10秒钟的有效语音注册,可以快速建立声纹模型,对话的过程也是实时进行比对,基本没有任何体感延迟。且整个过程不存储任何声纹数据。通过提前注册不同人的声纹,不仅能让 AI 分辨出多说话人声纹,知道是谁在说话。还可以针对不同任务的标签输出不同的对话策略与内容推荐,无
对话式 AI 引擎2.0 让 AI 更懂开口时机 支持预注册声纹识别与电话外呼
avatar声网公司
2025-12-04

双奖印证路径:声网以“ RTE + AI ”驱动产业纵深与体验革新

近日,声网先后获得两项行业重要认可——获评头部媒体36氪 WISE 2025商业之王“2025年度 AI 应用场景突破企业”与芥末堆 GET 教育科技大会“教育科技创新尖峰奖”。这标志着,声网推动“ RTE + AI ”技术深入产业肌理、转化为切实价值的实践,获得了跨领域的双重验证。 横向破圈:定义产业生产力,入选36氪「年度AI应用场景突破企业」 入选36氪“ WISE 2025商业之王”的“年度 AI 应用场景突破企业”,其核心准绳在于 AI 能否跨越概念,转化为真实的产业生产力。这要求企业不仅是技术专家,更是深入行业的“行动派”,能将技术落地为可验证的商业效率。声网的此次入选,正是对我们以 “RTE+AI ”构建通用商业基座这一务实路径的权威肯定。 在 AI 硬件领域,注入“有记忆的对话灵魂”:从能够记住孩子的喜好、能讲述定制化睡前故事的口袋机器人,到能完成从设置闹铃到预定机票等多样化任务的家庭助手,其背后稳定、拟人且连贯的实时互动能力,正由声网对话式 AI 引擎支撑。这标志着智能硬件正从集成智能体,向具有情感交互能力的伙伴演进。 在 AI 客服场景,实现“从应答到解决”的跨越:搭载声网对话式 AI 引擎的智能客服系统正从成本中心转变为价值创造者。当用户来电咨询时,不仅能准确理解意图,更能针对业务给出个性化建议或引导办理。这不仅将平均通话处理时长缩短了40%,更将大量人工座席从重复性查询中解放出来,专注于高价值服务,实现了效率与体验的双重升级。 在 AI 陪伴场景中,提供“深度的情绪共鸣”:在情感陪伴与社交应用中,通过对语音语调、语速及内容的实时多维分析,搭载声网解决方案的虚拟伴侣可以更细腻地感知用户情绪状态,并提供陪伴式倾听或舒缓引导,让技术成为可靠的情感连接器。 纵向深耕:重塑教学体验,荣膺芥末堆 GET「教育科技创新尖峰奖」 在作为行业风向标
双奖印证路径:声网以“ RTE + AI ”驱动产业纵深与体验革新
avatar声网公司
2025-11-20

声网母公司发布2025 Q3财报:连续四个季度GAAP盈利,营收同比增长12%

北京时间11月20日,声网母公司 Agora, Inc. ( NASDAQ:API ) 公布了2025年第三季度财报。财报显示,第三季度 Agora, Inc. 总营收3540万美元,同比增长12%。公司指引四季度收入区间为3700至3800万美元,同比增长7.2%—10.1%。 在美国通用会计准则(GAAP)下,Agora, Inc. 第三季度净利润为274万美元(约合人民币2000万元),净利润率 7.8%,继2024年Q4同比扭亏为盈后,已连续四个季度实现 GAAP 盈利。Agora, Inc. 创始人兼 CEO 赵斌表示, “我们欣然宣布,公司连续四个季度实现美国通用会计准则(GAAP)下的净利润,这得益于营收双位数同比增长和利润率的持续提升。我们的核心实时音视频云业务正呈现强劲复苏态势,正迈向疫情后首次全年营收增长,为公司构筑坚实而可持续的盈利基础。 与此同时,我们正大幅增加在对话式 AI 领域的投入。我们最新推出对话式 AI 引擎2.0版本与对话式 AI Studio,旨在帮助开发者更轻松地构建高度拟人、交互自然的语音对话智能体。来自全球客户的早期反馈令人鼓舞,随着应用场景与潜在客户的持续拓展,我们相信这将成为明年增长的重要动力。” 在现金储备方面,截至2025年9月30日,Agora, Inc. 现金、现金等价物、银行存款及银行理财产品为3.74亿美元。 对话式 AI 产品全栈发布 加速 RTE+AI 创新场景、应用落地 本季度,在AI技术驱动及新场景催化下,声网不断打磨、升级对话式 AI 能力,陆续发布了对话式 AI 开发套件 R1-4G、对话式 AI 引擎2.0、对话式 AI Studio、AI 模型评测平台(对话式)3.0,覆盖了从模型选择到测试、搭建、发布再到上线生产的全栈环节。 对话式 AI 开发套件 R1-4G,基于紫
声网母公司发布2025 Q3财报:连续四个季度GAAP盈利,营收同比增长12%
avatar声网公司
2025-11-19

声网 CEO 赵斌:对话式 AI 加速 RTE 进化,实时互动步入万亿分钟时代

在10月31日召开的声网 Convo AI & RTE 2025 第十一届实时互联网大会主论坛上,声网创始人兼 CEO 赵斌发表了题为《对话式 AI:实时互动的新篇章》主旨演讲。 在大会上,赵斌宣布了一项里程碑成就:声网年度服务分钟数首次突破“万亿分钟”,标志着实时互动(RTE)正式进入全新的规模化应用阶段。 今年 8 月,WebRTC 的全球搜索量出现了前所未有的激增,充分印证了开发者和行业对 RTE 技术的新一轮关注。随着强大的对话式 AI 工具进入市场,RTE 和通讯行业正迎来全新的发展机遇。 为助力企业和开发者抓住这一机遇,声网在大会上正式发布了《2025 对话式 AI 发展白皮书》及《对话式 AI 好奇者手册 》,为行业提供了一套系统的实践指南。同时,声网重磅推出了对话式 AI 引擎 2.0、对话式 AI 开发套件、对话式 AI 模型评测平台和 AI Studio,加速对话式 AI 在实时互动行业的应用创新,开启 RTE+AI 的新篇章。 赵斌强调,未来 RTE 将成为生成式 AI 时代的核心基础设施,支撑未来智能应用的无缝衔接与高效运行。然而,尽管技术进步带来了新机遇,数据安全与隐私保护依然是行业面临的严峻挑战。声网一直致力于通过先进的加密技术和严格的数据管理政策,确保用户数据的安全和隐私。此外,如何将 AI 硬件、端侧智能及具身智能高效融入实际场景,也是亟待解决的关键问题。 展望未来,对话式 AI 将不再仅仅停留在云端,而是深度嵌入端侧设备,真正赋能日常生活,推动实时互动行业迈入全新的增长篇章。 以下内容基于赵斌演讲全文整理: 欢迎大家再次相聚在金秋十月的北京,参加 Convo AI & RTE 2025 第十一届实时互联网大会,与开发者、合作伙伴、创业者及社区伙伴共同探讨行业现状、未来发展、以及潜在的机遇与挑战。正如现场播放的真实客户对话示例
声网 CEO 赵斌:对话式 AI 加速 RTE 进化,实时互动步入万亿分钟时代
avatar声网公司
2025-11-14

AI “爆改”泛娱乐,出海新物种正在诞生?

当“百模大战”逐渐偃旗息鼓,真正的 AI 战场已经从模型比拼转向应用落地。2025 年,越来越多泛娱乐产品开始用 AI 重塑玩法,从 AI NPC、AI 陪伴到 AI 短剧,AI 不再只是“加一点智能”,而是在底层改变内容的生产、分发与交互方式。同时在出海成为标配战略的 2025 年,“AI+泛娱乐+出海”也被越来越多创业者视为穿越周期的解题思路。 声网 Convo AI&RTE2025 专场汇聚了来自声网、MiniMax、腾讯云、逗逗 AI 等一线企业的实践者。他们不仅带来了 AI 时代泛娱乐产品的第一线观察,也分享了从中东到日韩,从 1V1 陪伴到多模态社交的最新探索路径。 声网杨帆:AI 如何赋能泛娱乐社交出海? 声网泛娱乐产品负责人杨帆围绕“AI 定义的社交娱乐和出海新形态”进行了深度分享,从区域趋势到 AI 技术落地,他结合最新数据与一线观察,系统阐述了当前泛娱乐产品出海的挑战与突破口。 从整体市场情况来看,2025 年前三季度,中东与东南亚依然是社交娱乐产品出海的重点增长区域,尤其中东市场体量庞大、用户年轻化趋势明显。但与此同时,买量成本的上涨、玩法的高度同质化,也让出海厂商在发展过程中遭遇瓶颈。他指出,“在阿联酋这样的地区,买量成本已接近北美。”此外,从平台角度来看,声网平台上出海开发者的增量明显,显示出越来越多国内厂商正积极寻求走出去的路径。 面对这样的竞争格局,杨帆将目光聚焦到“AI+社交”的新方向。他回顾了声网自 2023 年起在 AI 社交领域的探索过程,从早期从破冰提示试水,只能做 1v1,到去年正式推出集成 AI 降噪、超低延迟、优雅打断等能力的对话式 AI 引擎 1.0 版本,致力于解决多人通话延迟高、街头聚会等高噪音场合使用体验差等问题。 他还进一步拆解了对话类 AI 产品的两大核心路径:一是“效率型 AI”,比如破冰助理、客服、语言陪
AI “爆改”泛娱乐,出海新物种正在诞生?
avatar声网公司
2025-11-13

告别教育「不可能三角」,对话式AI带来新答案

个性化、高品质、大规模——教育行业的"不可能三角",正在AI时代迎来新的解题思路。 教育行业长期存在着一个看似无解的难题:线下小班课能够实现个性化和高品质教学,却难以规模化扩张;线上大班课解决了规模问题,却在个性化层面力不从心。这个困扰行业二十年的"不可能三角",在对话式 AI 技术快速发展的今天,正在显现突破的曙光。 在 Convo AI & RTE 2025 AI 教育专场上,声网与来自教育各细分领域的实践者,围绕"对话式 AI 重构教育新生态"展开深度探讨,描绘出一幅更具温度与效率的未来教育图景。 AI 教育大爆发 从“锦上添花”到“不可或缺” “去年 80 起教育行业融资中,AI 项目占 21 起;而今年上半年,这一比例在 25 起融资中激增至 22 起。”从这两年的融资数据中,可以观察出一个愈加清晰的信号:资本不再追逐教育行业表层的热度,而是转向更具产业协同性与长期价值的项目。声网教育产品负责人钱奋表示,当前大多数教育app产品呈现“ AI +高频刚需场景”的双重特征。这意味着,没有 AI 加持的项目,在今天几无可能获得市场认可。 声网教育产品负责人 钱奋 在这场 AI 浪潮中,各个细分赛道也呈现出不同的发展态势。钱奋指出,解题答疑、语言学习等刚需场景率先跑通商业模式,智能学习机成为家庭教育的新标配,而素质教育、AI 编程等领域正在快速崛起。 更深刻的变化发生在用户端。钱奋发现,“去年大家还在问‘ AI 说得对不对’,今年已经开始挑剔‘ AI 教得好不好’。”家长们不再满足于 AI 能够批改作业,而是期待 AI 能够理解孩子的学习状态,提供真正个性化的指导。从“学习工具”到“学习伙伴”的转变,正在教育领域真实发生。 对话式 AI 引擎 为教育场景注入“自然交互”能力 正基于此,声网今年推出全新的对话式 AI 引擎 2.0,可以在教育场景中实现更自
告别教育「不可能三角」,对话式AI带来新答案
avatar声网公司
2025-11-12

RTE &对话式 AI 产品专场:打造对话式 AI 全栈产品矩阵 重构人机交互体验

2025 年 10 月 31 日,在 RTE2025 实时互联网大会的 RTE & 对话式 AI 产品论坛上,声网携手商汤、MiniMax、科大讯飞等生态伙伴的专家带来了精彩的分享,他们分别从 AI 交互体验、对话式 AI 智能体开发、模型性能评测、语音大模型交互等多个角度共同探讨在对话式 AI 迎来爆发之际,如何快速落地对话式 AI 应用/产品,并打造极致的人机交互体验。 姚光华:从迭代到完善,声网对话式 AI 全栈产品矩阵的构建之路 声网 AI RTE 产品线负责人姚光华回顾了对话式 AI 产品的发展历程。去年此时,生成式 AI 是行业热点,而经过一年实践,声网已将对话式 AI 确定为长期战略投入。2024 年多个关键节点推动了对话式 AI 的发展,如 1 月李飞飞博士团队论文提出 Conversation Agent,5 月 OpenAI 计划在 ChatGPT App 推出多模态交互形式(实时语音对话),10 月 OpenAI 与 Agora 联合推出全球首个 To B Realtime API。 声网 AI RTE 产品线负责人姚光华 今年年初,声网推出的对话式 AI 引擎 1.0 以 “多快好省” 为特性,实现 650ms 快速响应与 “优雅打断”。此后八个月历经九次迭代,从 1.0 的 “能说会道” 发展到 1.7 的 “有形象、能专注、会观察”,再到 2.0 优雅打断进一步升级,并支持 SIP、PSTN 电话,实现一行代码,即可完成 AI 电话外呼。同时,对话式 AI 模型评测平台,从 1.0 的速度评测,到 2.0 的质量评测,再到 3.0 覆盖多模型、多厂商、多语种并兼顾成本,让模型选型更加科学、高效。最新推出的对话式 AI Studio1.0,提供可视化编排与生产级模板,不懂代码不懂音频参数也能 1 小时做出专属智能体。 姚光华表示,这些产品覆
RTE &对话式 AI 产品专场:打造对话式 AI 全栈产品矩阵 重构人机交互体验
avatar声网公司
2025-11-10

Convo AI&RTE2025 AI 硬件专场|当硬件学会"陪伴与理解",对话式AI重塑产业格局

在AI大模型浪潮的席卷下,智能硬件正站在一个全新的拐点。是继续在硬件上做功能的“加法”,还是回归用户需求,做体验的“乘法”?  在刚落幕的Convo AI & RTE2025大会—— AI 硬件专场上,声网与多位行业专家共同指出:一场从“硬件思维”到“体验思维”的范式革命,正在开启一个以“陪伴”为核心的新时代,而实时互动,正是点燃这场变革的关键引擎。 AI 硬件范式革命:告别“功能堆砌”,拥抱“情感链接” 当前,许多 AI 硬件企业仍陷于“功能堆砌”的内卷——先有硬件,再思考如何嵌入 AI 功能。这种做法往往导致 AI 被禁锢在硬件的“壳子”里,成为噱头大于实用的“表面智能”,无法与用户建立真正的共鸣。 “过去我们总想着‘设备上如何+ AI ’,但这本质上是一种限制。AI 就像一个被装进有限制壳子里的功能,无法与用户产生深度链接。” 声网 IoT 行业负责人吴昌儒在开场分享时指出这一尖锐问题。他认为,破局的关键在于将思维彻底反转,从 “IoT+AI”的硬件思维,转向“AI+IoT”的体验思维:首先洞察用户需要什么样的 AI 角色与情感陪伴,再让硬件成为这个 AI 人格的最佳载体。 声网IoT行业负责人吴昌儒 这一转变的背后,是三个正在发生的“跃迁”: 1、人机交互语言从“手动”变为“自然语言” 2、AI 从“算法”进化到“有个性” 3、使用场景从“功能 APP”转向“角色 Agent” 最终,人类与技术的关系正从“使用”转向“相处”。而市场的竞争核心,也从技术参数转向了情感链接的强度。 声网解决方案:夯实“AI+IoT”新范式的三维基石  挖掘“情感体验与智能交互”这片新蓝海,离不开稳定可
Convo AI&RTE2025 AI 硬件专场|当硬件学会"陪伴与理解",对话式AI重塑产业格局

去老虎APP查看更多动态