2023爱分析·大模型厂商全景报告|爱分析报告(2)

爱分析ifenxi
02-08

3.3 AI Agent

市场定义:

AI Agent是指以大模型为驱动,具有自主理解感知、规划、记忆和使用工具的能力,能自动化执行完成复杂任务的系统。

甲方终端用户:

企业IT部门、业务部门

甲方核心需求:

AI Agent相较于Copilot,有诸多能力的提升。其中,Planning能力是二者最大的区分,也是企业最为需要的能力项。Copilot需要明晰的Prompt才能发挥作用,AI Agent则与此不同,它可以自行规划并执行任务。AI Agent完成计划后,企业需要其调用组件来执行任务。对大企业而言,可能需要上百个AI Agent,需要对多AI Agent进行统一管理。

  • 企业需要AI Agent的Planning能力。AI Agent相较于Copilot,有诸多能力的提升。其中,Planning能力是二者最大的区分,也是企业最为需要的能力项。Copilot需要明晰的Prompt才能发挥作用,AI Agent则与此不同,它可以自行规划并执行任务,也可以调动一系列组件来完成目标,甚至可能探索周围环境。例如AI Agent可以知道用户所在公司差旅政策以及用户对航空公司、酒店的偏好信息,当用户跟它下达指令就可以说“帮我安排下周的行程”,它们将直接输出切实可行的方案。

  • 企业需要AI Agent调用组件来执行任务。AI Agent若要完成用户的任务指令,通常需要调用各种组件,例如文档处理组件、数据分析组件等。这将改变人与系统的交互方式,用户不再需要对系统功能以及操作路径进行记忆,而是通过自然语言让AI Agent调用组件来执行任务。

  • 企业需要对多AI Agent进行统一管理。目前来看,尚不具备满足所有场景需求的“超级AI Agent”,企业要针对不同场景构建多个AI Agent。对大企业而言,可能需要上百个AI Agent。如果考虑AI Agent的生命周期与更新低代,管理工作将变得更为复杂。因此,企业需要对多AI Agent进行统一管理。

厂商能力要求:

厂商需要具备构建AI Agent Planning能力的解决方案。当前,尚不具备成熟的、统一的构建方法,各家厂商各有千秋,包括结合专家SOP、引入CoT概念或ReAct模式等。AI Agent若要完成用户的任务指令,通常需要调用各种组件。相应地,厂商需要具备丰富的组件库,让AI Agent能真正发挥价值。对于企业的个性化需求,厂商应预留低代码开发模块来满足。企业需要对多AI Agent进行统一管理。从成本、安全等方面考虑,企业一般不会长期依赖厂商提供相关服务,而是需要一套成熟工具链实现能力内化。该工具链应该覆盖AI Agent构建与运营的全生命周期管理。

  • 厂商需要具备构建AI Agent Planning能力的解决方案。AI Agent相较于Copilot,有诸多能力的提升。其中,Planning能力是二者最大的区分,也是对企业最为需要的能力项。厂商需要具备构建AI Agent Planning能力的解决方案。当前,尚不具备成熟的、统一的构建方法,各家厂商各有千秋。有的厂商采用结合专家SOP的方式,由业务专家将业务流程梳理成SOP的形式,将其与大模型结合。此方法适用流程比较固定场景,例如财报分析、简历分析等。有的厂商在方案中引入CoT概念或者ReAct模式,让大模型生成关于任务指令的解决方案。

  • 厂商需要具备组件库和低代码能力。AI Agent若要完成用户的任务指令,通常需要调用各种组件,例如文档处理组件、数据分析组件等。并且,交互方式的改变是的用户无需记忆系统功能和操作路径,进而突破系统组件上限,进一步增加对组件的需求。相应地,厂商需要具备丰富的组件库,让AI Agent能真正发挥价值。对于企业的个性化需求,厂商应预留低代码开发模块来满足。

  • 厂商应提供AI Agent构建与运营的全生命周期管理平台。企业需要对多AI Agent进行统一管理。从成本、安全等方面考虑,企业一般不会长期依赖厂商提供相关服务,而是需要一套成熟工具链实现能力内化。该工具链应该覆盖AI Agent构建与运营的全生命周期。

入选标准说明:

1. 符合AI Agent市场分析的厂商能力要求;

2. 近一年厂商在该市场至少服务1家企业(含POC)。

代表厂商评估:

澜码科技

厂商介绍:

澜码科技是一家基于大语言模型的Agent平台公司,是国内探索大语言模型应用落地和AI Agent的先行者。基于底层大语言模型,澜码科技自主研发了能够连接人和系统的企业级Agent平台“AskXBOT”,助力企业构建基于专家知识的超级自动化,从而提升业务质量和效率。

产品服务介绍:

AskXBOT平台是澜码科技自主研发的基于大语言模型的企业级AI Agent平台。平台集Agent与工作流设计、开发、使用、管理,以及知识沉淀于一体。在AskXBOT平台上,企业可以用对话的方式提出需求,设计、创建和管理 Agent,快速定制企业级 AI Agent 来完成各类任务,包括财报分析、组卷判卷、供应商资质审查、智能风控、财务审核、经营分析、招聘助手等。

厂商评估:

澜码科技助力企业实现“专家知识普惠”,提升基层员工生产力。并且,澜码科技已构建较完善的业务价值体系,搭配成功案例可快速推进AI Agent立项。AI Agent属于新兴领域,澜码科技是该领域的先行者。针对“企业如何建设AI Agent”的问题,澜码科技经过探索已沉淀出一套较完整的方法论。在商业模式方面,澜码科技较为独特,提出了“先有收益,再分配”的商业模式,希望与行业伙伴共建AI Agent生态。

  • 澜码科技助力企业实现“专家知识普惠”,提升基层员工生产力。过去,企业业务专家的经验主要通过“SOP文件+培训”的方式传递至基础岗位员工,传递过程存在大量损耗,导致成本较高且效果欠佳。基于AskXBOT 平台,企业可以将专家知识快速传递给基层员工,实现知识普惠,进而提升基层员工生产力。具体而言,AskXBOT 平台先将专家知识教给AI Agent,然后让其赋能大量基层员工,帮助他们将工作能力由“新手”、“高级新手”快速成长为熟练级的胜任者,工作状态也相应地从仓促应对转变为从容胜任。例如,某银行借助AskXBOT平台在短期内对18万名员工完成保险业务培训,这在过去是难以实现的。

  • 澜码科技已构建较完善的业务价值体系,搭配成功案例可快速推进AI Agent立项。讲清楚大模型业务价值是CEO同意将大模型纳入企业未来规划的必要条件之一。大模型厂商需要构建自己的业务价值体系,与CIO/CTO合作推动企业管理层对大模型及其应用的价值认同,最终实现立项。澜码科技围绕AskXBOT平台构建了一套较为完善的业务价值体系,包括增收、降本、提效和降风险等要点。同时,澜码科技已在金融、教育、零售、政务等行业落地多个成功案例,可作为业务价值的佐证用来增强对CEO的说服力。

  • 增收相关案例:某银行在信贷申请高峰期人手不够,一般有两种处理选项。一是降低审核标准,加快审核速度,但会带来更多坏账风险;二是坚守审核标准,但过长的等待时间会将客户推向其他银行。澜码科技利用AskXBOT平台把审核专家的知识通过CUI的方式让一线初级员工也能用起来,在保证审核质量的同时缩短审核时间,留住更多潜在信贷客户,实现增收。

  • 降本相关案例:某海外汉语教学机构服务于一带一路上多个国家的学员,对他们进行汉语培训与考试。考试的工作流程一般是先由汉语专家确定考试模板,再需要初级和中级教育人员执行出题与翻译工作。当前,该机构聘请了5名全职教研员和150名外聘实习教师从事第二阶段的工作。澜码科技利用AskXBOT平台可以迅速完成出题工作,帮助该机构减少对初级和中级教育人员的人力支出。

  • 澜码科技探索出较完整的AI Agent建设方法论,并提供全流程服务。AI Agent属于新兴领域,澜码科技是该领域的先行者。针对“企业如何建设AI Agent”的问题,澜码科技经过探索已沉淀出一套较完整的方法论。

图5:澜码科技AI Agent建设方法论

澜码科技的AI Agent建设方法论包括三个步骤。第一步是把企业关键业务流程所需要的专家知识进行数字化处理,包括梳理问答、搭建指标中台等。第二步是基于CUI的柔**互,致力于让系统适应人,而不是人适应系统。第三步是把整个使用过程记录下来,作为持续补充和优化专家知识的依据。

AI Agent建设过程中涉及专家知识梳理、指标中台搭建等工作,澜码可提供相关服务。为满足企业需求,澜码科技配备了专业的知识团队,职能类似于传统AI时代的数据标注团队。并且,澜码科技的创始人兼CEO周健也可参与指导项目,贡献行业及流程Know-how。周健曾是依图科技的10号员工和弘玑Cyclone CTO,具备多年B2B一线业务经验。

  • 澜码科技提出“先有收益,再分配”的商业模式,希望与行业伙伴共建AI Agent生态。澜码科技致力于与合作伙伴建立更深层次的合作。具体而言,澜码科技负责提供AskXBOT平台等生产力工具以及相关服务,由合作伙伴提供专家知识和业务场景。待双方合作取得业务收益之后,在进行收益分配。并且,澜码科技将遵循排他性的合作原则,在每个细分行业中只合作一家企业。

  • 如今,猎头,咨询、电商选品等多个行业的数家企业对该合作模式感兴趣,已与澜码科技进入商务谈判环节。

典型客户:

太平保险、桃李中文、CGL、超级导购、湖北省市场监督管理局

3.4 通用大模型

市场定义:

通用大模型是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的非开源免费模型。

甲方终端用户:

行业头部企业IT部门

甲方核心需求:

大多数企业只需要大模型应用,而头部企业对大模型的需求则不局限于此。通用大模型是头部企业IT基础的重要拼图之一,企业需要依托通用大模型进行能力建设。企业需要通用大模型可以支撑业务,发挥价值。并且,企业需要“通用大模型+算力”的综合解决方案来应对“卡荒”。

  • 企业需要依托通用大模型进行能力建设。大多数企业只需要大模型应用,而头部企业对大模型的需求则不局限于此。通用大模型是头部企业IT基础的重要拼图之一,企业需要依托通用大模型进行能力建设。企业需要通用大模型支撑多种业务场景,例如客服、数据分析、营销素材生成等。这些场景映射到模型本身,则对模型能力提出要求,包括文本生成、SQL生成、多模态等。当前,尚不存在“六边形战士”类的全能大模型,头部企业可以通过采购、部署多个通用大模型,共同完成大模型能力建设。

  • 企业需要通用大模型可以支撑业务,发挥价值。部署通用大模型并不能直接为企业带来价值,还需要“改造”和“开发”。改造是指结合企业私有数据进行微调甚至后训练,以便其更好地执行特定任务。开发是指需要基于通用大模型开发全新的上层应用或者赋能已有的IT系统。

  • 企业需要“通用大模型+算力”的综合解决方案来应对“卡荒”。 通用大模型的微调、推理需要高端AI芯片作为算力底座。但是,美国政府持续扩大针对中国芯片的出口限制,加剧了国内算力供应的压力,AI芯片价格持续走高且一卡难求。企业通常需要“通用大模型+算力”的综合解决方案来应对“卡荒”,解决对算力的后顾之忧。

厂商能力要求:

企业基于对通用大模型的需求,向厂商提出多项能力要求。一是通用大模型需要具备鲜明的能力特点。二是厂商需要提供大模型应用开发工具、LLMOps工具、AI Agent等工具层产品。三是厂商需要具备足够的高端AI芯片,并具备以华为升腾为代表的国产化芯片替代方案。

  • 通用大模型需要具备鲜明的能力特点。头部企业需要依托通用大模型进行能力建设。当前,尚不存在“六边形战士”类的全能大模型,头部企业可以通过采购、部署多个通用大模型,共同完成大模型能力建设。因此,通用大模型需要具备鲜明的能力特点,与企业需求进行匹配。能力特点包括文本生成、SQL生成、多模态、知识检索、多轮对话、提示词长度等。

  • 厂商需要提供大模型应用开发工具、LLMOps工具、AI Agent等工具层产品。出于成本和安全等因素考量,企业需要实现大模型改造和开发能力的内化。除通用大模型和算力之外,厂商通常需要提供大模型应用开发工具、LLMOps工具、AI Agent等工具层产品。涵盖大模型应用开发、大模型微调、大模型运维、AI Agent构建与运维等多个方面。

  • 厂商需要具备足够的高端AI芯片,并具备以华为升腾为代表的国产化芯片替代方案。企业需要“通用大模型+算力”的综合解决方案来应对“卡荒”。相应地,厂商需要具备足够的高端AI芯片,才能满足企业需求。鉴于美国芯片供应的不确定性持续增加、国产芯片的崛起以及国产化替代事业的推进等多重因素,将国产芯片应用于微调、推理场景是大势所趋。厂商应具备以国产化芯片替代方案。当前,华为升腾910是最热门的替代方案。

入选标准说明:

1. 符合通用大模型市场分析的厂商能力要求;

2. 近一年厂商在该市场至少服务1家企业(含POC)。

代表厂商评估:

出门问问

厂商介绍:

出门问问是一家以生成式AI和语音交互为核心的人工智能公司,为全球多个国家的创作者和企业提供AIGC工具、AI政企服务,以及AI智能硬件。出门问问致力于打造国际领先的通用大模型,通过AI技术、产品及商业化三位一体发展,成为全球AI CoPilot的引领者。

产品服务介绍:

出门问问基于自研通用大模型——序列猴子,面向全球多个国家的创作者和企业提供一系列大模型产品及解决方案。「序列猴子」大模型以语言为核心的能力体系,涵盖“知识、对话、数学、逻辑、推理、规划”六个维度。特别的是,该模型拥有优秀的跨模态知识迁移能力,能够将语言模型所涵盖的常识知识有效转化应用于其他非语言模态的模型当中。目前出门问问自研大模型「序列猴子」已通过备案,向全社会开放.

图6:出门问问AIGC SaaS

  • 魔音工坊是一款AI配音及多人协同创作工具,具备软件配音、云剪辑、一键分析视频、文案提取、捏声音等功能。目前,「序列猴子」大模型赋能语音合成引擎,使其AI配音产品“魔音工坊”实现轻量数据极速克隆,情感效果媲美真人。魔音工坊还推出了面向海外内容创作者的海外版“DupDub”和企业可通过API整合部署的企业版。

  • 奇妙元是一款数字人产品,可用于短视频制作以及网络直播,该产品不仅可以生成数字人形象,而且可以自动生成文案。

  • 奇妙问是出门问问推出的“企业AI交互式数字员工生成平台”,面向政企、文旅等行业,打造数字接待、数字客服、数字销售等交互型数字员工。

图7序列猴子大模型

厂商评估:

出门问问深耕AI与大模型,具有深厚的技术和客户积累。出门问问的大模型产品不局限于单一文本模态,而是聚焦多模态。出门问问通过提供多模态大模型应用,为企业实现深度赋能。除多模态之外,出门问问还依托Agent技术打造企业知识助手、数据分析助手和自定义流程助手,致力于提升通用大模型的可用性和业务价值。在产品可用性方面,出门问问基于自研大模型解决“问答系统响应慢”难题,让问答系统更可用。在商业化方面,出门问问在内容创作领域已建立完整的大模型产品业务价值评估体系,有利于企业快速推进大模型立项。

  • 出门问问深耕AI与大模型,具有深厚的技术和客户积累。出门问问是一家以生成式AI和语音交互为核心的人工智能公司,具有619项AI相关知识产权。该厂商已推出多款AI穿戴设备,以及汽车、金融和医疗等行业AI解决方案,是业内少有的具备软硬件集成能力的AI公司。在大模型方面,出门问问布局时间早于大部分厂商,其在2021年6月发布大模型“UCLAI”,并在2023年4月发布大模型“序列猴子”。

  • 出门问问持续关注大模型前沿技术,其在AI Agent方面具备一定研究成果,并推出了一款相关产品。出门问问的AI Agent产品为面试机器人,属于奇妙问产品旗下。面试机器人主要应用于面试模拟场景,机器人基于面试背景设定以及使用者的简历信息,可以主动与使用者进行交流。另外,出门问问正聚焦“文案一键智能生成视频”技术研究,希望将其应用于网络短剧的快速制作。

  • 出门问问具有深厚的客户基础,其在传统AI时代推出的魔音工坊、奇妙元等产品已积累大量客户。这些产品已完成大模型升级,提升了对客户的价值和吸引力。当前,魔音工坊、奇妙元等产品已积累约60万付费客户。并且,出门问问在大模型时代全新推出的奇妙元产品也已签约多家企业,进入交付阶段。

图8:魔音工坊产品能力与商业化进程

  • 出门问问为企业提供多模态大模型应用,实现深度赋能。出门问问聚焦多模态,致力于让“序列猴子”大模型具备统辖音频、图像、视频等不同模态内容的能力,实现对企业场景更全面、更深度的覆盖。在音频方面,出门问问打造魔音工坊;在图像方面,出门问问打造奇妙元;在视频方面,出门问问正聚焦“文案一键智能生成视频”技术研究。

  • 与业界聚焦多模态 Agent 方向的总趋势一致,出门问问推出了全新产品——奇妙问。奇妙问是出门问问多模态能力的集大成者,其将聪明的大脑、动听的声音和好看的外表融为一体,并与不同场景的大屏进行结合,为企业打造具备数字接待、数字客服、数字销售等职能的数字员工。

  • 出门问问依托Agent,提升通用大模型的可用性和业务价值。Agent兴起,成为大模型价值落地的主要方式之一。出门问问依托Agent技术打造企业知识助手、数据分析助手和自定义流程助手,致力于提升通用大模型的可用性和业务价值。

  • 企业知识助手通过整合企业私有知识库来丰富大型模型的知识储备。这种整合使得Agent能够提供基于自然语言的、交互式的企业专有知识查询服务。进而解决通用大型模型在应对企业应用场景时因领域知识不足而产生的误导性问题,即幻觉问题。企业知识助手已在工商银行私人银行落地应用。

  • 出门问问基于大模型构建的数据分析助手能够通过将自然语言转化为数据分析语言或代码,例如调用API、访问数据库乃至编写数据分析代码,从而高效地获取、分析和可视化数据,为企业决策提供有力支持。克服传统BI工具常面临的使用难度大、高度依赖技术团队、结果反馈慢等问题。数据分析助手已在某半导体显示产品龙头企业落地应用。

  • 理想的Agent应当在接收一套工具集和相关知识后,它能依靠大型模型的理解和推理能力独立地规划并拆解任务,设计出具体的执行步骤。它能智能地运用各种工具,检索所需知识,生成内容,并最终完成任务。然而,在企业实际应用中,由于各企业的知识体系、应用场景和业务需求差异巨大,加上大型模型本身存在的不确定性,这种“放手”式的做法往往带来不可预测的结果。出门问问基于此推出自定义流程助手,致力于满足企业对Agent的可控性需求,即对AI的执行过程和细节进行更精细的控制,确保AI能够按照人类确认过的工作流程来执行任务。自定义流程助手已在某智慧交通龙头企业落地应用。

  • 出门问问基于自研大模型解决“问答系统响应慢”难题,提升问答系统可用性。问答系统是现阶段大模型最主流的应用之一。当使用者向问答系统提出问题之后,一般会经过声音转文字,大模型推理等环节才能呈现答案。如果是数字员工形态的的问答系统,还需进行渲染处理。使用者耐心有限,问答系统必须压缩各个环节时间,实现对问题的快速响应。然而,大模型推理环节一般耗时较长。因此,加快推理速度是厂商打造可用问答系统的“必答题”。

  • 出门问问的解决方案是降低大模型“体积”,从而获得推理速度的提升。该方案的核心要点在于找到大模型推理效果和推理时间的最佳平衡点。出门问问自主研发通用大模型“序列猴子”,其在大模型预训练、微调等技术方面底蕴深厚。出门问问通过对自研大模型的灵活调整,已找到该最佳平衡点,解决了“问答系统响应慢”难题,让旗下的问答系统(奇妙问)更可用。

  • 在内容创作领域,出门问问已建立完整的大模型产品业务价值评估体系。大模型“出圈”效应显著,许多企业高管表达出对大模型及其应用的浓厚兴趣。但从实际立项情况来看,大模型项目立项并不顺利。主要原因在于CEO等企业一把手希望看到大模型的业务价值,而较多IT负责人难以表达清楚。出门问问在内容创作领域深耕多年,积累数十万名付费客户。出门问问面对内容生产商和内容批发商等内容创作领域的参与者,总结出一套业务价值评估体系。该体系包括业务价值构成以及衡量价值的关键指标,有利于企业快速推进大模型立项。

典型客户:

中国工商银行、某能源类央企、某半导体显示产品龙头企业、某大型石化企业、某智慧交通龙头企业

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法