客户端下载

logo

当前位置:首页 > 资讯 > 资讯详情

中国车企的座舱智能体,如何学习Grok、超越Grok?

HiEV大蒜粒车研所 | 7小时前

2829

作者 |德新

编辑 |王博

去年上海车展,「全民智驾」是最热的关键词,当时车企争先量产是端到端城区辅助驾驶,谁先把高阶智驾推向更广泛的用户,谁就更容易抓到市场的注意力。转眼到了 2026 年北京车展,汽车行业再次被 AI 的风暴裹挟,但注意力的焦点来到了座舱智能体。

这波座舱智能体上车,背后至少有两层直接刺激。 第一是特斯拉在2025年推动 Grok 上车,让汽车行业第一次较为完整地感受到,座舱大模型不只是一个更聪明的语音助手,它可以带来新的交互、信息获取方式,以及更强的陪伴感和情绪价值。

第二,则是2026年初智能体热潮的迅速爆发。OpenClaw 的走红,让整个行业进一步意识到,AI 不应该只停留在“聊天”层,而是要进入“执行”层,真正变成一个能理解目标、调用工具、完成任务的系统。

也正因此,围绕「车载智能体」,中国汽车行业正在展开新一轮竞争。4月21日,荣威宣布与火山引擎深度合作在行业内第一家打造「AI原生汽车」,算是拉开了这轮新角逐的序幕。

如果说去年的关键词是“端到端智驾”,那今年北京车展的隐藏关键词就是“AI 智能体”。 座舱智能体,正在成为车企打造 AI 汽车的一道新分水岭。

一、学习Grok,超越Grok

座舱智能体要大热,其实早有先兆。

HiEV 获悉,在几个月前的美国 CES 期间,多家国内车企的 CTO 带队在当地试驾特斯拉,重点体验当时最新的 FSD V14.2,以及刚上车不久的 Grok。

期间,不少车企中层甚至专门从洛杉矶、旧金山等地驱车前往拉斯维加斯,完整体验数百甚至上千英里的「FSD + Grok」。

特斯拉对 Grok 的接入其实还很克制,它的车端能力有限,更多是与导航结合,没有深入车控。但即便如此,Grok 所展现出来的大模型能力,仍然给很多业内人士留下了很深的印象:更自然的对话、更强的检索能力以及情绪。它展示出一种明显不同于传统车机语音助手的交互质感。 这让行业内意识到,车内的交互入口,正在被大模型重新定义。

过去,车内语音系统解决的更多是“命令识别”问题:用户一句相对标准的指令,语音助手将其映射为车控操作。但大模型带来的变化是,系统开始尝试理解更自然、更模糊的表达,并进一步接手信息获取、任务拆解乃至行动执行。

在这之后,追赶特斯拉「FSD + Grok」的组合,迅速成为国内激进派车企和供应链玩家的共识。 到了北京车展上,围绕「中国版 Grok」和更广义的车载智能体,已经至少出现了三类玩家。

第一类,是头部模型公司与云服务商。

火山引擎发布基于AI智能体架构的新一代解决方案,目标是帮助车企打造AI大脑,通过联通车控、导航、智驾等关键功能域,实现 "感知 - 推理 - 执行 - 记忆 - 学习" 一体化闭环。

这个AI大脑,支持以完整产品(豆包座舱助手)交付或者灵活选配(AI座舱套件)的方式与车企开展合作。

第二类,是芯片与基础平台公司。比如地平线,除了推出舱驾融合平台星空,也发布了座舱智能体平台「KakaClaw」,希望把智能体做成下一代平台的核心能力。

第三类,则是开始自研或者半自研智能体能力的主机厂,它们的目标不是接入一个助手,而是把智能体本身,变成品牌体验的一部分。

准确地说,北京车展上扎堆出现的,已经不是“中国版 Grok”,而是一个更深度接入车辆、能在真实物理世界中为用户服务的车载智能体。人们不再满足于 AI 只是能说会道,而是开始被要求真正“做事”。

而中国市场恰恰为这个变化提供了很好的土壤。

过去几年,新能源汽车快速发展,车内电子电气架构不断演进,SOA 软件架构也逐渐成熟,这使得大模型不再只是停留在屏幕里,而是开始真正接入车控、接入服务、接入车辆状态系统,新一代助手,开始第一次真正进入车里的物理世界。

二、为什么汽车成为AI落地最快的终端?

一个有意思的问题是:为什么 AI 手机还没有普及,汽车却成为第一批被 AI 深度改造的硬件终端?

汽车是天然是一个非常适合智能体落地的场景。手机端的人机交互体验已经非常成熟、丝滑,火山引擎副总裁、火山引擎汽车业务负责人杨立伟认为,相比之下,汽车的人机交互还有很大的挖掘空间,如果能从50分提升到80分,用户感知会非常明显。

其次,AI 模型的效果,很大程度上依赖上下文。汽车恰恰是一个高上下文、高感知密度、同时又拥有明确可调用能力的终端。它知道用户在哪、要去哪里、车里有谁、当前时间、车外环境、车端硬件设备状态等等,这些信息都能成为 AI 理解用户需求的上下文输入。

最后,汽车又不是一个纯粹信息终端。它拥有大量可以被调用的能力:空调、车窗、座椅、导航、娱乐系统、车辆状态,未来甚至可以进一步连接泊车、行车以及外部服务。这意味着 AI 上车以后,不仅能“理解”,还更容易“执行”。 用户的一句话,最终可以变成空调调节、路线规划、音乐切换、座椅联动,甚至进一步变成一个个复杂任务的自动编排。

以这届车展上发布的新一代豆包座舱助手为例,它所展示出来的,已经不是传统语音助手那种“听清楚一句命令,再执行一个动作”的逻辑,而更接近一个成形的智能体。

在技术架构上,它包含了对话推理引擎、目标驱动引擎、学习成长引擎三大引擎:

对话推理引擎,可以实现像真人一样自然交流,而不需要人像过去一样以相对固定、机械的方反倒适应车端语音。通过端侧的大模型拒识、VLM识别和豆包输入法同款的ASR能力,豆包在车端的对话可以做到全时免唤醒词和多人对话,每次交流都会在该出现的时候自然加入对话,也可以随时打断、随时插话。

目标驱动引擎,基于任务目标和环境反馈自主调用车载的工具,让车机能像真人一样处理事务。它可以把复杂、多步骤、跨场景的任务,从头到尾帮你办完,不用你反复交代。例如,根据后排孩子的状态和车端记忆,选用合适的多种方式:唱歌、放动画片、讲故事、做游戏、哄睡等,陪伴孩子整个旅途。

学习成长引擎,像人一样不断在过程中总结经验,持续改进。这个学习的范围不限于偏好、话题、场景类等基础记忆能力,还能在任务执行过程里沉淀经验,形成可复用的Skill。

这三大引擎支持豆包的模型上车之后,能像人一样自由交流、办事高效有智商,并且伴随着使用越来越好用,从而成为一个真正可以成长的AI大脑。

在北京车展之前,荣威已经与火山引擎宣布深度战略合作。荣威新的家越序列,将与火山引擎联合开发的AI大脑,荣威将其定义为新一代「AI 原生汽车」。家越序列首批一口气规划了三款车型09/07/06,其中第一款车07将在6月的火山引擎Force大会上展示能力预览。

这种深度合作背后反映出,主机厂对于下一代座舱入口的判断:谁先把 AI 内化为核心能力,谁就更有机会在下一轮竞争中占据主动。

三、座舱智能体真正的分水岭,是能不能做事

今天大模型上车,和过去传统车内语音助手最大的差别,到底是什么? 表面上看,似乎是对话更自然、情绪价值更高,但本质上是能不能做事。

过去车内的语音助手,更加像一个基于规则的自然语言处理系统(NLU),因此它一般只能处理相对固定、明确的命令——比如“把空调调到22度”、“打开主驾座椅加热”等等,这样的系统在面对模糊表达、复杂上下文、多轮任务以及跨功能调度时,往往会迅速暴露出局限。

有车企软件工程师对 HiEV 形容,过去很多车内语音系统,某种程度上就是「分词器」。而今天大模型带来的变化是,语言模型开始被接到车端的 function call(函数调用) 以及状态系统上。

简单来说,就是让模型不仅理解用户说了什么,还能进一步调用车上的具体能力,把语言真正翻译成执行动作。状态系统的接入则意味着,AI 在执行动作时,不是盲目地下发命令,而是会参考当前车辆和座舱的实际状态:车窗是否已经打开、座椅加热是否开启、用户是否处于疲劳状态、车辆当前是否处于安全可执行的场景。这两者结合在一起,才让 AI 在车上恰到好处地「提供服务」。

以火山引擎的思路为例,内部团队大约从2023年开始就将一部分研究重心放在了用AI模型来生成 function call,而当时汽车行业大部分其他的团队还热衷于让AI闲聊或者画画。

在能够利用大模型进行稳定的车端原子能力的控制之后,他们又进一步引入了环境变量和端状态(车内的设备状态),这样让模型在决策时能够理解上下文、降低误判,并尽量降低“幻觉”。

某种程度上,这跟辅助驾驶的端到端类似,也是一种座舱大模型的「端到端」。

四、AI上车,真正改变的是什么?

这轮车载智能体升级带来什么变化?

首先,用户视角下,车端的对话体验会从聊天走向任务闭环。 过去,车机是一问一答;今天,新的车载智能体更重要的能力,是把一个目标拆解成若干动作,并推动任务走向完成。用户一句模糊的意图,系统就能够理解、规划、执行,并在必要时继续追问或调整。

功能开发的视角,类似豆包座舱助手这样的AI大脑把智驾、座舱、车控、导航、环境感知等整车功能域打通,它越来越像一个调度中枢,那未来车机比拼的也是谁有更多、更好用的完整skill。

第三层,技术部署上,从云端智能走向端云混合。 车里的很多能力,不可能完全依赖云端,涉及实时响应、隐私和安全决策等能力,更多会放在端侧;而更复杂的知识推理、长链条规划和外部信息获取,则仍然适合由云端提供支持。

未来的车载智能体,大概率不会是一个纯粹的云端AI,而是一套端云协同的系统工程。 譬如火山引擎这次也跟与英伟达深度合作推出端侧AI产品“火山聆眸”,基于英伟达的计算平台,豆包端侧模型具备视觉理解能力,能在保障用户隐私、本地处理的前提下,提供多模态的交互体验。

到2026年北京车展,汽车行业已经开始更普遍意识到:AI 不只是给车增加了一个助手,它更可能重写的是车内的入口、交互方式,甚至品牌差异化的逻辑。

过去几年,汽车行业先卷尺寸,再卷舒适配置,也卷过了辅助驾驶,从这届车展开始,竞争正在进入一个新的阶段:谁能把车载智能体做成真正的入口,谁就有机会在下一轮 AI 汽车竞争中掌握更大的主动权。

水滴汽车公众号
扫码关注,获取更多汽车资讯
水滴汽车
扫码下载水滴汽车APP

热门评论(0)

加载更多

热门车系资讯

更多 >

D7 DMH

12.58-14.58万元

雅阁

17.98-25.98万元

奥迪 e-tron

54.68-64.88万元

杰德

12.99-18.38万元

思域

11.99-16.99万元

  1. 北京水滴交互网络科技有限公司

Copyright @ 水滴汽车 京ICP备17030485号-2

京公网备 11010102003639号