2025年11月3日,明略科技在港交所主板挂牌上市,首日股价暴涨超过110%,市值一度突破400亿港元。资本市场用真金白银投票,表达了对这家数据智能企业的认可。但明略又一大动作,发生在上市不到三个月后的2026年1月——面向全球开源First Data,目前最全面的结构化数据源知识库。
这不是一次普通的技术发布。在AIGC内容泛滥、AI幻觉问题日益严重的当下,明略选择将耗费大量人力技术提炼的核心资产以MIT协议完全开源,其战略意义远超技术层面。作为长期跟踪科技产业的观察者,我们认为这代表着AI竞赛正在进入新的阶段——从"比参数"到"比可信",从"卷算力"到"卷底座"。
AI幻觉:一个被低估的产业瓶颈
要理解明略的战略选择,需要先看清AI行业正在发生的深刻变化。
过去两年,大模型赛道经历了疯狂的参数竞赛。从百亿级到千亿级再到万亿级,各家厂商不断刷新数字。但一个尴尬的现实是:企业级市场的渗透率远低于预期。问题出在哪里?答案藏在"幻觉"这两个字上。
AI幻觉指的是大模型生成看似合理但实际错误的内容。在聊天娱乐场景,这可能只是个小瑕疵;但在金融分析、法律咨询、医疗诊断等专业领域,一次幻觉就可能带来严重后果。据行业调研数据显示,通用大模型在专业场景的幻觉率普遍处于较高水平,这直接导致企业客户的态度从"想用"变成了"不敢用"。
更棘手的是幻觉的传染效应。当AI生成的内容大规模涌入互联网,大模型开始"用AIGC训练AIGC",质量形成螺旋式下降。一个AI产生错误信息,被另一个AI引用传播,假信息就这样在数字世界里完成了自我验证的闭环。学术界将这种现象称为"模型崩溃"。
明略科技敏锐地捕捉到了这个痛点。他们提出的核心理念是"Clean Data大于Big Model"——高质量数据优于大模型。这句话的潜台词非常清晰:在人工智能的底层架构中,数据质量比模型规模更具决定性意义。
明略的解法:三层可信架构
明略所自研的DeepMiner产品线同样基于这一理念,其核心架构可以概括为知识图谱、垂直数据和可信机制的三重保障。
第一层保障来自明略积累了二十年的知识图谱资产。这些图谱覆盖零售、制造等多个行业,经过长期业务验证,形成了结构化的"事实网络"。当DeepMiner生成内容时,会不断与知识图谱进行比对,确保输出不偏离事实边界。
第二层保障是高质量的行业垂直数据。与通用大模型依赖互联网数据不同,明略与超过135家财富500强企业建立了数据合作关系,在合规前提下使用其历史案例、业务文档和专家经验进行模型优化。
第三层保障是完整的可信机制,包括输出溯源、推理可视化和置信度评估。DeepMiner的每条结论都能追溯到知识来源,推理过程清晰可见,不确定的时候会明确表达不确定性。
这种设计理念在实际应用中得到了验证。在金融行业的商业分析场景中,DeepMiner展现出了显著的优势——能够在短时间内完成万条社媒数据的分析处理,准确率保持在较高水平。更重要的是,业务部门的接受度明显提高,"敢用"成为关键词。某零售企业的技术负责人表示,相比通用大模型,DeepMiner在专业问题上的表现更加稳定可控,每条回复都有据可查。
First Data:AI时代的"事实底座"
如果说DeepMiner是明略的产品护城河,那么First Data的开源就是在构建生态护城河。
First Data的定位是全球最全面的结构化数据源知识库,计划收录超过1000个全球权威信源。它的设计体现了明略对"可信"二字的深刻理解——绝非简单的网址导航,而是一套高度精密、机器可读的结构化元数据体系。
First Data为每个收录的信源定义了详尽的元数据,包括API接口、更新频率、覆盖维度,以及严格的六大权威等级分类。政府、国际组织、学术机构等信源被赋予最高优先级,这种分级机制为AI智能体提供了高质量的"过滤器"。更重要的是,First Data坚持所有结论必须能够"回到原文",实现百分之百的URL验证和证据回溯。
First Data对MCP协议的深度集成也值得关注。这意味着像Claude这样的顶尖AI应用可以通过First Data直接挂载一个"外挂大脑"。以前金融分析师需要花费数小时检索的宏观指标,现在AI可以在秒级锁定权威信源并提供API级的数据指引,这种工作流的重塑才是真正的生产力革命。
填补"中国空白":数字主权的争夺
First Data的推出还填补了一个长期存在的"中国空白"。
在全球开源数据谱系中,关于中国的高质量结构化数据源往往是碎片化甚至缺失的,这导致国际AI模型对中国经济的理解经常出现偏差。First Data专门规划收录了超过488个中国权威数据源,从中国人民银行的货币政策到国家统计局的宏观指标,再到各大行业协会的披露,这些核心事实被系统性地整理并采用中英双语设计。
这不仅填补了全球数据图谱的中国缺憾,更是中国企业在AI基础设施领域输出"中国标准"的典范。通过打破语言和技术壁垒,全球AI生态可以更准确、更客观地读懂中国。
开源背后的战略意图
在数据资产被视为核心护城河的当下,明略选择开源First Data,战略意图可以从三个维度理解。
首先是标准制定权的争夺。当全球开发者都采用First Data作为事实底座时,明略就掌握了AI时代权威数据源的定义权。
其次是网络效应的构建。开源社区会持续补充、审核和优化数据源,形成分布式维护的数据生态,其可信度将远超单一企业维护的数据库。
第三是降低行业门槛,吸引更多企业进入明略的生态体系。企业无需投入大量资源自建数据基础设施,可以直接基于First Data搭建可信AI应用。
这种"开放"恰恰是最高级的锁定——当全球AI应用都依赖First Data作为事实底座时,明略就构建了一个难以替代的生态位。
财务拐点:从烧钱到盈利
从财务角度看,明略科技已经展现出从烧钱到盈利的拐点信号。
2025年上半年,公司实现营收约6.44亿元人民币,同比增长13.9%,毛利率达到55.9%。更关键的是,经调整运营利润首次转正,达到2688万元。研发费用率从2022年的59.16%下降至23.37%,说明前期的技术积累正在进入收获期。
腾讯作为战略股东持股约22.36%,双方在数据智能领域的协同空间值得期待。当前明略的市值约400亿港元,对应2025年预期收入的市销率约为13倍。对比美股AI应用领域的标杆企业Palantir约30倍的市销率,明略的估值水平存在提升空间。
AI下半场的信号
AI行业正在经历从上半场到下半场的切换。
上半场比拼的是参数规模、算力投入和生成速度,这是通用大模型的竞技场。下半场比拼的是专业深度、可信机制和商业落地能力,这是企业级AI的决胜场。
明略科技用二十年的数据积累换取了一张下半场的入场券,First Data的开源则是这盘大棋的关键落子。First Data不只是一个技术产品,它代表了一种理念:在AI时代,真实比智能更稀缺,可信比强大更重要。
当全球AI产业都在为幻觉问题寻找解决方案的时候,明略选择做那个"守底线"的人。从400亿市值到全球开源,明略正在重新定义AI竞赛的规则——不是让模型更聪明,而是让模型更靠谱。
这盘棋,下得很大,也很远。
精彩评论