作者|青苹吹果编辑|无心插柳柳橙汁如果有个AI告诉你,三个月后某只股票会跌,或者某个国家会加关税,你怎么判断它说的是真话,还是在瞎蒙?唯一的方法就是——等三个月,一切见分晓。但这就陷入了一个死循环:要验证预测,就得等结果出来;等结果出来,黄花菜都凉了。更尴尬的是,就算它蒙对了,你也不知道下次还能不能信它。市面上号称能“预测”的AI产品一大堆,但没几个敢把历史预测记录全公开的。大部分都是挑几个说中的案例出来吹,说错的就当没发生过。直到最近,UniPat AI发布了一套系统,名字叫Echo,核心是一个专门为预测训练的模型EchoZ-1.0,并在公开的 General AI Prediction Leaderboard 上稳居第一,领先Google的Gemini-3.1-Pro和Anthropic的Claude-Opus-4.6。在涵盖12个模型、覆盖政治、经济、体育、科技、加密货币等7个领域、活跃题目超过1000道的排行榜中,EchoZ-1.0以Elo 1034.2的分数排名榜首,其竞争对手不仅有顶级大模型,还有预测市场上真实投入资金的人类交易者。这意味着EchoZ的预测能力已经相当能打了。我花了两个晚上把他们的技术博客和公开数据翻了一遍,发现他们做了一件挺有意思的事。Echo不仅让AI学会了预测未来,更重要的是,他们建立了一套,让任何人都能验证“预测准不准”的方法论。比谁预测得准得先站在同一起跑线 过去一年,几乎所有头部大模型厂商都在卷预测能力。Google、Anthropic、OpenAI,一个比一个卷。但问题是,怎么证明自己的模型真的比别人强?传统的做法是搞一个排行榜,让各家模型对着同一批题目做预测,然后比谁的正确率高。听起来公平,但有一个致命漏洞:时序不对称。举个例子。假设有道题是“2026年4月20日收盘时,全球市值最大的公司是哪家?”模型A在4月1日预测
作者|青苹吹果编辑|无心插柳柳橙汁你有没有发现,最近几年,老外们像是在经历一场“中式血脉”的集体觉醒。先是组团来中国旅游,把“China Travel”刷成TikTok流量密码;接着又掀起跨境医疗热,跑到中国看病、体检、甚至做手术。而如今,这股“薅社会主义羊毛”的风,也是刮到了AI圈。全球AI模型聚合平台OpenRouter显示,今年2月中旬开始,中国模型的调用量已超过美国,美国用户占比高达47%,越来越多的海外开发者开始批量调用中国大模型的API。没办法,谁叫咱中国的模型“物美价廉”呢。跑同样的任务,用美国模型可能要5美元,用中国模型只要0.3美元。账单直接“打骨折”,这谁看了不心动?乍一听,这好像是个打价格战的故事,但实则往深了想,国产模型打“价格战”的底气从哪儿来?归根结底,是电力在撑腰。这让我想起了最近,老黄在个人博客发表的一篇长文《AI is a Five Layer Cake》。文中提出了AI产业的 「五层蛋糕」 模型,将AI拆成了能源、芯片、基础设施、模型、应用,五个层面,并反复强调:每个成功的应用,都会向下拉动它下面所有层,一直延伸到维持它运转的发电厂。照老黄所说,咱们现在只吃上了AI“五层蛋糕”的第一口。未来,AI不再仅仅是一款应用或一个模型,而是会像互联网一样,成为现代社会不可或缺的基础设施。到那个时候,AI对电力的需求,可能会“无穷无尽”。AI的胃口变大了过去两年,我们习惯了用AI聊天、写文案、画图。但今年年初,一个叫OpenClaw的开源工具让局面彻底变了。OpenClaw能够7×24小时地运转,而且TA不局限于聊天,更能自己操纵电脑、点鼠标、填表格,直接让你解放双手!当然,这么能干的AI Agent,“工资”自然低不了,如果仅仅是对话,一次交互消耗的Token量可能只是几百个,但要完成一次特定任务,从执行到交付的整个过程,能够消耗几十万甚至上百万个