中国车企的座舱智能体，如何学习Grok、超越Grok？-水滴汽车

中国车企的座舱智能体，如何学习Grok、超越Grok？

HiEV大蒜粒车研所 | 04-25

19500

作者 |德新

编辑 |王博

去年上海车展，「全民智驾」是最热的关键词，当时车企争先量产是端到端城区辅助驾驶，谁先把高阶智驾推向更广泛的用户，谁就更容易抓到市场的注意力。转眼到了 2026 年北京车展，汽车行业再次被 AI 的风暴裹挟，但注意力的焦点来到了座舱智能体。

这波座舱智能体上车，背后至少有两层直接刺激。第一是特斯拉在2025年推动 Grok 上车，让汽车行业第一次较为完整地感受到，座舱大模型不只是一个更聪明的语音助手，它可以带来新的交互、信息获取方式，以及更强的陪伴感和情绪价值。

第二，则是2026年初智能体热潮的迅速爆发。OpenClaw 的走红，让整个行业进一步意识到，AI 不应该只停留在“聊天”层，而是要进入“执行”层，真正变成一个能理解目标、调用工具、完成任务的系统。

也正因此，围绕「车载智能体」，中国汽车行业正在展开新一轮竞争。4月21日，荣威宣布与火山引擎深度合作在行业内第一家打造「AI原生汽车」，算是拉开了这轮新角逐的序幕。

如果说去年的关键词是“端到端智驾”，那今年北京车展的隐藏关键词就是“AI 智能体”。座舱智能体，正在成为车企打造 AI 汽车的一道新分水岭。

一、学习Grok，超越Grok

座舱智能体要大热，其实早有先兆。

HiEV 获悉，在几个月前的美国 CES 期间，多家国内车企的 CTO 带队在当地试驾特斯拉，重点体验当时最新的 FSD V14.2，以及刚上车不久的 Grok。

期间，不少车企中层甚至专门从洛杉矶、旧金山等地驱车前往拉斯维加斯，完整体验数百甚至上千英里的「FSD + Grok」。

特斯拉对 Grok 的接入其实还很克制，它的车端能力有限，更多是与导航结合，没有深入车控。但即便如此，Grok 所展现出来的大模型能力，仍然给很多业内人士留下了很深的印象：更自然的对话、更强的检索能力以及情绪。它展示出一种明显不同于传统车机语音助手的交互质感。这让行业内意识到，车内的交互入口，正在被大模型重新定义。

过去，车内语音系统解决的更多是“命令识别”问题：用户一句相对标准的指令，语音助手将其映射为车控操作。但大模型带来的变化是，系统开始尝试理解更自然、更模糊的表达，并进一步接手信息获取、任务拆解乃至行动执行。

在这之后，追赶特斯拉「FSD + Grok」的组合，迅速成为国内激进派车企和供应链玩家的共识。到了北京车展上，围绕「中国版 Grok」和更广义的车载智能体，已经至少出现了三类玩家。

第一类，是头部模型公司与云服务商。

火山引擎发布基于AI智能体架构的新一代解决方案，目标是帮助车企打造AI大脑，通过联通车控、导航、智驾等关键功能域，实现 "感知 - 推理 - 执行 - 记忆 - 学习" 一体化闭环。

这个AI大脑，支持以完整产品（豆包座舱助手）交付或者灵活选配（AI座舱套件）的方式与车企开展合作。

第二类，是芯片与基础平台公司。比如地平线，除了推出舱驾融合平台星空，也发布了座舱智能体平台「KakaClaw」，希望把智能体做成下一代平台的核心能力。

第三类，则是开始自研或者半自研智能体能力的主机厂，它们的目标不是接入一个助手，而是把智能体本身，变成品牌体验的一部分。

准确地说，北京车展上扎堆出现的，已经不是“中国版 Grok”，而是一个更深度接入车辆、能在真实物理世界中为用户服务的车载智能体。人们不再满足于 AI 只是能说会道，而是开始被要求真正“做事”。

而中国市场恰恰为这个变化提供了很好的土壤。

过去几年，新能源汽车快速发展，车内电子电气架构不断演进，SOA 软件架构也逐渐成熟，这使得大模型不再只是停留在屏幕里，而是开始真正接入车控、接入服务、接入车辆状态系统，新一代助手，开始第一次真正进入车里的物理世界。

二、为什么汽车成为AI落地最快的终端？

一个有意思的问题是：为什么 AI 手机还没有普及，汽车却成为第一批被 AI 深度改造的硬件终端？

汽车是天然是一个非常适合智能体落地的场景。手机端的人机交互体验已经非常成熟、丝滑，火山引擎副总裁、火山引擎汽车业务负责人杨立伟认为，相比之下，汽车的人机交互还有很大的挖掘空间，如果能从50分提升到80分，用户感知会非常明显。

其次，AI 模型的效果，很大程度上依赖上下文。汽车恰恰是一个高上下文、高感知密度、同时又拥有明确可调用能力的终端。它知道用户在哪、要去哪里、车里有谁、当前时间、车外环境、车端硬件设备状态等等，这些信息都能成为 AI 理解用户需求的上下文输入。

最后，汽车又不是一个纯粹信息终端。它拥有大量可以被调用的能力：空调、车窗、座椅、导航、娱乐系统、车辆状态，未来甚至可以进一步连接泊车、行车以及外部服务。这意味着 AI 上车以后，不仅能“理解”，还更容易“执行”。用户的一句话，最终可以变成空调调节、路线规划、音乐切换、座椅联动，甚至进一步变成一个个复杂任务的自动编排。

以这届车展上发布的新一代豆包座舱助手为例，它所展示出来的，已经不是传统语音助手那种“听清楚一句命令，再执行一个动作”的逻辑，而更接近一个成形的智能体。

在技术架构上，它包含了对话推理引擎、目标驱动引擎、学习成长引擎三大引擎：

对话推理引擎，可以实现像真人一样自然交流，而不需要人像过去一样以相对固定、机械的方反倒适应车端语音。通过端侧的大模型拒识、VLM识别和豆包输入法同款的ASR能力，豆包在车端的对话可以做到全时免唤醒词和多人对话，每次交流都会在该出现的时候自然加入对话，也可以随时打断、随时插话。

目标驱动引擎，基于任务目标和环境反馈自主调用车载的工具，让车机能像真人一样处理事务。它可以把复杂、多步骤、跨场景的任务，从头到尾帮你办完，不用你反复交代。例如，根据后排孩子的状态和车端记忆，选用合适的多种方式：唱歌、放动画片、讲故事、做游戏、哄睡等，陪伴孩子整个旅途。

学习成长引擎，像人一样不断在过程中总结经验，持续改进。这个学习的范围不限于偏好、话题、场景类等基础记忆能力，还能在任务执行过程里沉淀经验，形成可复用的Skill。

这三大引擎支持豆包的模型上车之后，能像人一样自由交流、办事高效有智商，并且伴随着使用越来越好用，从而成为一个真正可以成长的AI大脑。

在北京车展之前，荣威已经与火山引擎宣布深度战略合作。荣威新的家越序列，将与火山引擎联合开发的AI大脑，荣威将其定义为新一代「AI 原生汽车」。家越序列首批一口气规划了三款车型09/07/06，其中第一款车07将在6月的火山引擎Force大会上展示能力预览。

这种深度合作背后反映出，主机厂对于下一代座舱入口的判断：谁先把 AI 内化为核心能力，谁就更有机会在下一轮竞争中占据主动。

三、座舱智能体真正的分水岭，是能不能做事

今天大模型上车，和过去传统车内语音助手最大的差别，到底是什么？表面上看，似乎是对话更自然、情绪价值更高，但本质上是能不能做事。

过去车内的语音助手，更加像一个基于规则的自然语言处理系统（NLU），因此它一般只能处理相对固定、明确的命令——比如“把空调调到22度”、“打开主驾座椅加热”等等，这样的系统在面对模糊表达、复杂上下文、多轮任务以及跨功能调度时，往往会迅速暴露出局限。

有车企软件工程师对 HiEV 形容，过去很多车内语音系统，某种程度上就是「分词器」。而今天大模型带来的变化是，语言模型开始被接到车端的 function call（函数调用）以及状态系统上。

简单来说，就是让模型不仅理解用户说了什么，还能进一步调用车上的具体能力，把语言真正翻译成执行动作。状态系统的接入则意味着，AI 在执行动作时，不是盲目地下发命令，而是会参考当前车辆和座舱的实际状态：车窗是否已经打开、座椅加热是否开启、用户是否处于疲劳状态、车辆当前是否处于安全可执行的场景。这两者结合在一起，才让 AI 在车上恰到好处地「提供服务」。

以火山引擎的思路为例，内部团队大约从2023年开始就将一部分研究重心放在了用AI模型来生成 function call，而当时汽车行业大部分其他的团队还热衷于让AI闲聊或者画画。

在能够利用大模型进行稳定的车端原子能力的控制之后，他们又进一步引入了环境变量和端状态（车内的设备状态），这样让模型在决策时能够理解上下文、降低误判，并尽量降低“幻觉”。

某种程度上，这跟辅助驾驶的端到端类似，也是一种座舱大模型的「端到端」。

四、AI上车，真正改变的是什么？

这轮车载智能体升级带来什么变化？

首先，用户视角下，车端的对话体验会从聊天走向任务闭环。过去，车机是一问一答；今天，新的车载智能体更重要的能力，是把一个目标拆解成若干动作，并推动任务走向完成。用户一句模糊的意图，系统就能够理解、规划、执行，并在必要时继续追问或调整。

功能开发的视角，类似豆包座舱助手这样的AI大脑把智驾、座舱、车控、导航、环境感知等整车功能域打通，它越来越像一个调度中枢，那未来车机比拼的也是谁有更多、更好用的完整skill。

第三层，技术部署上，从云端智能走向端云混合。车里的很多能力，不可能完全依赖云端，涉及实时响应、隐私和安全决策等能力，更多会放在端侧；而更复杂的知识推理、长链条规划和外部信息获取，则仍然适合由云端提供支持。

未来的车载智能体，大概率不会是一个纯粹的云端AI，而是一套端云协同的系统工程。譬如火山引擎这次也跟与英伟达深度合作推出端侧AI产品“火山聆眸”，基于英伟达的计算平台，豆包端侧模型具备视觉理解能力，能在保障用户隐私、本地处理的前提下，提供多模态的交互体验。

到2026年北京车展，汽车行业已经开始更普遍意识到：AI 不只是给车增加了一个助手，它更可能重写的是车内的入口、交互方式，甚至品牌差异化的逻辑。

过去几年，汽车行业先卷尺寸，再卷舒适配置，也卷过了辅助驾驶，从这届车展开始，竞争正在进入一个新的阶段：谁能把车载智能体做成真正的入口，谁就有机会在下一轮 AI 汽车竞争中掌握更大的主动权。

水滴汽车公众号

扫码关注，获取更多汽车资讯

水滴汽车

扫码下载水滴汽车APP

热门评论(0)