“自动驾驶软件可能接近天花板了,但是物理 AI 刚开始。” 文丨李安琪 编辑丨龚方毅 2022 年下半年,通用汽车旗下的 Cruise 在旧金山晚高峰跑了一趟一个半小时的 Robotaxi(无人驾驶出租车),全程零接管。不久后公司请 Sam Altman 做了一场内部炉边谈话,当时在 Cruise 做机器学习和计算机视觉研究的刘先明和同事们聊起这趟行程,很骄傲。而 Sam Altman 一直在说他们正在做的 ChatGPT —— 当时没太多人在意。 几个月后 OpenAI 发布 ChatGPT,一个足够简单的模型架构,加上足够大的参数量、数据和算力,展现出超越预期的智能。刘先明说当时被震撼了,他想也许沿着同样的路径,不用手写成千上万条规则,不用给系统装五颗激光雷达再把沿街会遮挡传感器的树枝修剪一遍,智能驾驶也有机会涌现出智能。 2024 年初,他带着这个判断加入小鹏汽车。在小鹏硅谷办公室第一次见何小鹏时,他想的是 “如果他听不懂我在说什么,我就不来了”。 今年 3 月,基于这套逻辑开发的小鹏汽车第二代 VLA [1](视觉-语言-动作模型)开始上车。这也是刘先明加入小鹏以来最完整的一次交付。因为太多同行想测,一辆装了新版软件的试驾车,日租金一度被炒到八千元。 交付后,我们在小鹏的上海研发办公室见到了刘先明。他剃个圆寸头、戴黑框眼镜、说话温和,是 i 人但因为工作成了话痨。熟人评价他 “目标感很清晰,能力非常综合,既能讲很深的技术,也能把复杂问题说清楚”。 刘先明在小鹏汽车历任北美 AI 负责人、基座模型负责人、自动驾驶中心负责人,2026 年 2 月出任通用智能中心负责人,统管智驾和座舱这两个原先的一级部门。在他之前,吴新宙为小鹏建立了智驾第一梯队的行业认知,李力耘用工程和规则把 “端到端” 高阶辅助驾驶推向全国量产。刘先明要做的是自研基座模型,拆掉语言翻译,让模型从视频和