声网公司
声网公司官方号
老虎认证: 声网成立于2014年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。
IP属地:上海
12关注
15212粉丝
声网成立于2014年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。
avatar声网公司
2024-09-06

构建AI实时音视频互动 声网这套方案听、看、思、说样样精通

图片 在生成式人工智能领域,大模型多模态交互能力的升级正掀起一股新的 AI 浪潮,在 RTC 能力的加持下,人与 AI 的交互不再局限于文字,也可以通过语音通话进行生动、流畅的低延时交互,这也成为当下国内外大模型厂商新的发力点。 今年5月,GPT-4o 的发布开创了AI 实时语音交互的先河。在此之前,一些传统的大模型已经具备语音交互的能力,但一般采用 WebSocket 方案,这一方案虽然应用广泛,但其传输架构是基于 TCP 协议来构建,延迟较高,在 STT-LLM-TTS 的三步骤中,一个来回的延迟就要2-3秒,在弱网等非理想网络环境下,整体语音交互的延时更达到4秒+。在 GPT-4o 采用 RTC 方案后,展现出了自然、流畅的低延时语音交互体验,也让更多企业与开发者看到了在 AI 语音交互中 RTC 方案的更优性,并积极与 RTC 厂商合作,升级 AI 语音交互的体验。 声网对话式AI解决方案 构建实时多模态AI语音交互   声网作为全球实时互动云行业的开创者,在音视频领域积累了深厚的技术优势与场景实践,通过与客户在 AIGC 场景的深度合作,探索出了一套实时多模态对话式 AI 解决方案,该方案以语音为核心,支持视频扩展,实现文本/音频/图像/视频的组合输入&输出,通过丰富的功能构建真实、自然的 AI 语音交互体验。 例如对交互延迟进行优化,延迟可做到1s以内;支持 AI 降噪、背景人声过滤,让语音对话更纯静;支持随时打断与超拟人化人声合成,让对话更智能与逼真;同时还支持灵活可扩展的 AI Agent 架构等一系列功能,帮助开发者与企业快速构建适配自己业务场景的 AI 实时语音对话服务。 图:声网实时多模态对话式AI解决方案架构图 1、延迟低于1s,极速响应:声网实时多模态对话式AI解决方案可做到语音对话延迟低于1s。通过在客户端进行低延迟的
构建AI实时音视频互动 声网这套方案听、看、思、说样样精通
avatar声网公司
2025-06-17

MiniMax、星野、智谱清言,这些 AI 应用都在用声网打造对话式 AI 体验!

在生成式 AI 的浪潮下,基于实时互动技术的对话式 AI 正加速在各行各业落地实践。一起来看看,这些 AI 应用都是如何利用声网技术,来打造极致对话式 AI 体验的吧!🤩 🔮多模态 AI 智能体创作平台 - 星野 基于 MiniMax 在文本、声音、视觉模型下的先进能力,以及声网的对话式 AI 技术,在星野,用户与 AI 智能体可实现秒回、清晰、流畅的实时语音对话,再搭配超拟人的 AI 音色,让 AI 交互更接近人类的真实对话,成为用户娱乐、工作、学习中的 AI 伙伴。 🙌AI 智能助手 - MiniMax Chat 在声网的助力下,MiniMax 的语音对话体验成为亮点功能之一,响应速度快,AI 秒回你的提问与指令,即使在弱网、嘈杂的环境下,也能与 AI 助手实现清晰、流畅的对话,同时基于 MiniMax 出色的新一代语音大模型,AI 的声音逼真、语气自然,能流畅处理多语种混合输出,还提供调节语速和更换声音的功能,且操作方便、效果逼真。 🙌AI 智能助手 - 智谱清言 2024年8月智谱清言上线国内首个视频通话功能,结合了智谱出色的音视频理解模型和情感语音模型,清言能够看到和理解用户所处环境,更好地提供问答、翻译、导游、作业辅导等功能。在声网对话式 AI 技术的助力下,智谱清言的视频通话延迟更低,对话更流畅。上线三个月,清言视频通话功能已拥有 100万用户。 🤖家庭陪伴机器人 - 赋之 EBO Air 2 Plus EBO Air 2 Plus探索了全新 AI 玩法,通过声网对话式 AI 引擎,让用户可与多个大模型助手展开对话,支持6大角色,20+音色,无论是知识问答、互动聊天、还是情感陪伴,都能一键与 AI 实现自然、流畅的真实互动体验,让 AI 更具温度,赋能生活,从而提升家庭幸福感。 🧸AI 儿童教育机器人 - Miko 通过声网提供的对话式 AI 技术,Miko
MiniMax、星野、智谱清言,这些 AI 应用都在用声网打造对话式 AI 体验!
avatar声网公司
2024-08-30

满屏尽播“黑神话” 直播平台直面泼天流量

图片 8月20日,饱受玩家期待的中国首款 3A 游戏《黑神话:悟空》正式上线,很快引爆全网。该游戏以《西游记》为背景,讲述玩家扮演的“天命人”,为了探寻昔日传说的真相,踏上一条充满危险与惊奇的西游之路。 图源网络,侵删 《黑神话:悟空》上线前就已成为全网流量焦点,正式上线后,各大直播平台更是被《黑神话:悟空》占领,主播、玩家齐刷屏,满屏尽播“黑神话”。据报道,上线当天,抖音游戏直播榜前十里多数在玩《黑神话:悟空》,其中还包括了张大仙等头部主播;斗鱼直接开设了“黑神话:悟空”的分区;B站直播同时在线人数超过了200万。 “黑神话”带来直播热,也能看到玩家对于游戏品质的要求越来越高。对于主播来说,直播时的优质画质可以吸引更多观众的关注和参与。尤其是 PC 端 3A 大作和 MOBA、FPS、RPG 等中重度手游,这类游戏场景切换频繁,游戏细节丰富,对画质要求更高。 此外,帧率影响着游戏画面的流畅性,如果帧率不足会使游戏场景、动作跳帧严重、不连贯、卡顿明显,尤其是对于 3A 游戏,眩晕感会明显加重。而分辨率影响游戏画面清晰度,如果分辨率低,则画面展示不够清晰、细腻,也会造成观感体验不佳。 不掉帧、无卡顿、低延时 尽享4K 60帧观看体验 声网通过对采集和编码侧的核心技术优化,在屏幕共享过程中,保证实时视频编码,让性能消耗最低、编码效率最高,最终实现不掉帧、无卡顿、低延时、超高清的游戏直播互动体验,真正做到把大片级 4K 60帧观看体验搬到普通玩家的日常游戏直播中。 拿“黑神话”举例,通过该直播方案,在主播直播过程中,可以实时捕捉并呈现“天命人”棍势切换,完美闪避、变身广智等关键动作,将画面中的撞击、爆炸、飞沙走石、得胜等渲染效果逼真的呈现,让观众端实现与主播端同步的极致高清画面观看体验。 支持观众端灵活切换观看视角 大局、细节尽在掌握 玩家观看游戏直播,不仅为
满屏尽播“黑神话” 直播平台直面泼天流量
avatar声网公司
2021-08-10

声网发布2021年Q2财报:营收4233万美元,连续9个季度稳健增长

北京时间8月10日,全球实时互动云服务商声网Agora(NASDAQ:API)发布了2021年第二季度财务报告。财报显示,声网Agora在2021年第二季度实现了4233万美元总营收,2020年同期为3390万美元,同比增长25%。如剔除2020年上半年新冠疫情在中国市场的短期影响,声网 Q2营收则实现57%的同比增长,并连续9个季度保持稳健增长。客户规模方面,截至2021年6月30日,声网全球注册应用超33.7万个,同比增长55%;与此同时,声网在本季度也获得了更多中长尾开发者的支持,活跃客户数量达2449个,同比增长65%。“声网Agora刚刚度过作为公众公司的第一年。回顾过去一年,我们非常自豪能够在这个充满挑战的时期帮助世界各地的人们实现情感连接。我们正在和平台上的每一位开发者一起,改变人们工作、学习、娱乐甚至生活的方式。”声网Agora创始人兼CEO赵斌表示,“我要感谢所有开发者、客户和合作伙伴对声网Agora的信任。我们将继续致力于通过技术帮助人们建立情感连接,并创造更多实时互动的可能性。”现金流方面,作为技术驱动型PaaS服务商,声网依然拥有稳定、充足的资金来保障长期的研发投入,为未来业务发展提供夯实基础。据财报显示,2021年第二季度,声网现金、现金等价物及短期投资为8.27亿美元。释放生态力量,打造RTE赛道创业孵化器生态赋能是声网在技术、产品、服务之外,构建核心竞争力的关键一环。对于RTE行业创业伙伴的支持,声网一直在努力前行。去年,声网与五源资本联合发起的“RTE2020实时互联网创业挑战赛”受到了创业者和投资者的好评,以及实时互动创业圈的广泛关注。今年7月,声网Agora再次联合五源资本,推出创业伙伴系列活动--「超音速计划」。帮助实时互动领域的创业企业加速成长,共同定义和扩大实时互动赛道,建立实时互动领域顶尖创业社群。在超音速计划中,声网将携手顶级投
声网发布2021年Q2财报:营收4233万美元,连续9个季度稳健增长

CES 2026丨声网联合博通集成发布 R2 全场景 AI 机器人开发套件

CES 2026 期间,声网联合中国领先的无线连接芯片设计企业博通集成正式发布基于 BK7259 芯片的“ R2 全场景 AI 机器人开发套件”。陆吾智能旗下“陆卡卡”作为该方案在桌面机器人场景的标杆产品,同步亮相展会。 陆卡卡在 CES 声网兄弟公司 Agora 展位 R1 到 R2 的升级: 从“能听会说”迈向“能看会动” 去年3月,声网 R1 开发套件一经发布,珞博智能的“芙崽Fuzozo”便成为声网首批客户。 在京东2025年6·18大促期间, Fuzozo 在 AI 玩具竞速榜中表现亮眼,旗下“金木水火土”五个款式占据当天竞速榜前六位。市场对 Fuzozo 的广泛认可,验证了 R1 套件出色的实力与市场潜力。 芙崽在 CES 声网兄弟公司 Agora 展位 本次推出的 R2 套件则是在 R1 基础上的技术、功能升级,并标志着声网端侧 AI 交互能力从“能听会说”到“能看会动”的正式跨越。 R2 完整继承了 R1 系列业界领先的全双工对话、背景降噪、流畅打断等实时 AI 语音交互能力。并新增以下突破性功能: 本地视觉识别与处理能力: 依托 BK7259 芯片强大的集成 NPU 与 ISP,R2 新增本地视觉识别与处理能力。这意味着机器人可以实现人脸跟踪、手势识别、物体跟随等复杂功能,让实时交互从“语音”扩展到“视觉”。 实现具身互动,让机器人更具“活人感”: R2 支持多自由度运动控制,结合视觉与语音功能,助力机器人实现“走到用户面前打招呼”、“转头注视说话者”等富有生命感的情感化肢体交互。 诸多合作伙伴产品联合参展: 陆卡卡、Lookee、Choochoo 、小匠、二白机器人等在现场 定义“全场景”: 一套基座,赋能多元硬件创新 R2 的能力边界不止于桌面机器人。其设计初衷是为需要融合“感知-决策-动作”的 AI 硬件提供标准化参考,为各类创新硬件提供一套经过验证
CES 2026丨声网联合博通集成发布 R2 全场景 AI 机器人开发套件
avatar声网公司
2022-02-23
一图看懂声网2021Q4及全年财报成绩单
avatar声网公司
2022-05-24

声网发布 2022 年 Q1 财报:营收 3859 万美元

北京时间5月24日,全球实时互动云服务商声网(NASDAQ:API)发布了截至 2022 年 3 月 31 日的第一季度财报。财报显示,2022 年 Q1 声网实现营收 3859 万美元。客户规模方面,截至 2022 年 3 月 31 日,声网全球注册应用超 43.9 万个,同比增长 43%;全球活跃客户数量达 2706 个,同比增长 16 %。“面对瞬息万变的市场环境,我们在一季度实现了稳健的经营业绩。在中东、东南亚及欧洲等市场,开发者使用声网平台创造了身临其境的实时互动体验,来自这些市场的收入持续高速增长。我们尤为欣喜地看到,人们的生活不断向线上迁移,沉浸于更多的虚拟互动场景之中,这一现象的背后也折射出人们思维与行为方式的长期转变。”声网创始人兼 CEO 赵斌表示。在现金流方面,声网依然拥有稳定、充足的资金来保障长期的研发投入,为未来业务发展提供坚实基础。财报显示,截至 2022 年 3 月 31 日,声网现金、现金等价物及短期投资为 7.18 亿美元。全球领先,稳居实时互动云市场份额第一作为全球化企业,声网致力于帮助全球客户做好实时音视频互动体验,以及落地相关实时互动场景解决方案,并且一直占据着全球实时互动云市场份额第一的位置。根据独立第三方行业研究与分析机构 CIC 灼识咨询发布的《2021 年全球实时互动云(RTE-PaaS)行业研究报告》(以下简称“报告”)显示,作为实时互动云服务行业开创者和引领者,声网继续蝉联全球实时互动解决方案市场份额第一,根据 2021 年实时互动解决方案支持的实时互动音视频分钟数及年度营收两个指标计算,声网的全球市场占有率均遥遥领先其他服务商。同时,据财报显示,第一季度声网在中东、东南亚及欧洲等市场的收入持续高速增长。目前,声网的全球化业务服务已覆盖中东、东南亚、北美、拉丁美洲、日韩等区域的全球 200 多个国家和地区。在不断开拓和深化
声网发布 2022 年 Q1 财报:营收 3859 万美元

去老虎APP查看更多动态