这次广州车展,小米要发布小米辅助驾驶增强版。怎么理解这个增强版,我觉得可以参考昨天 xAI 发布的 Grok 4.1。我理解 Grok 4 和 4.1 的模型架构和预训练基本上是一样的,但是在后训练放大了强化学习训练的规模,让模型的幻觉下降,情商提高,整个模型性能表现好了很多。小米这个辅助驾驶增强版也不涉及基本架构的大改,但是增加了很多强化学习的训练工作。我之前的微博里发过,强化学习的逻辑很像我们小时候学骑自行车的过程,学骑车一半是忽然之间找到了平衡的骑法,学习这个骑法,另一半是找不到平衡摔了,后面再骑要规避那么骑,因为会摔。辅助驾驶在世界模型的仿真器里学习驾驶,结合 AI 工程师设计的奖励和惩罚机制,模型开得好就给奖励信号,模型开得差就惩罚,就这么一点点学到人想要的安全、效率和舒适相平衡的开法。用上强化学习后,小米辅助驾驶增强版的表现有了很明显的改善。我坦诚说大家现阶段不要和最头部的比,要做到最头部,小米还需要一点时间。但和小米之前的辅助驾驶比,这一版已经有很大的进步了,车主们可以期待一下。

