《 21世纪商业先驱报》的实习记者Xuyang报告说:“ AI是一天,一年在世界上。” AI公司的联合创始人曾经以这种方式描述了大型模型的开发速度。 2023年3月,OpenAI发布了GPT4。很快,新的Sora和O1模型就诞生了,AI爆炸了。这些重要事件受到许多新汽车公司的启发。小米自动驾驶副总裁李·利扬(Li Liyun)在“ 21 Auto·See Auto”中说,在2023年初,米彭开始探索如何在自主驾驶领域端到端应用。去年下半年,米彭开始朝着基于云的大型模型迈进。最近,在AI Big Model Technology的封闭式会议上,Li liyun说,小木是Bumubuor的超大规模自动驾驶模型,具有720亿个参数,尤其是“小米世界基础模型”。 So -so -call Xiaopeng世界基本模型是一种多模式的大型模型Al网络并使用大量的多模式驾驶数据。它具有视觉理解,理性链(COT)和动作生成的能力。米彭希望世界基本模型得到真正的理解,认可,甚至改变物理世界。物理AI也是完美自动驾驶解决方案的最新方向。今年3月,在NVIDIA的2025年春季GTC会议上推出了完美自动驾驶技术研发的负责人Jia Peng,该会议很好地部署了一个大型Mindvla模型,其参数为22亿个车辆。从完美的角度来看,使用VLA的原因是由于自动驾驶(例如机器人)将解决AI如何与物理世界相互作用的问题。但是,小米和完美之间的最大区别是,米彭尚未将模型直接延伸到车辆的尽头,而是对云中大型基本模型的首次训练,然后占据其本质并放置“ Distilled" small model at the end of the vehicle. This cloud-side distillation technical solution has been proven on this year's famous deptseek paper. Xiaopeng tried to break the model limit caused by the car terminal due to lack of AI computing power. Xiaopeng calls the process of making the cloud-to-end "cloud model factory". Relies on strong AI computing power infrastructure and mechanism nG data processing, the entire "cloud model factory" currently has a full cycle of从云到末端的变化每5天都可以达到一个新力量的内幕。最后两个业务是完美的领域,Nio尚未进入。他们目前正在专注于AI汽车。因此,米彭需要一个更大,更好的基础模型。在战斗中,由三个兄弟拥有的Nio似乎有点孤单。尼奥(Nio)是中国第一家全面推动高速NOA的汽车公司,但是随着行业转移到“无地图”和端到端的大型车型时,Nio稍微慢了。去年7月27日在Nio Innovation Technology Day,Nio智能驾驶副总裁Ren Shaoqing发行了Nio World Model NWM(Nio World Model)。 NWM优化了端到端的体系结构,可以充分了解数据,重建物理世界以及想象长期减少和决策的能力。但是,由于NIO自治部门的组织和许多路线的探索,最终由于工业和信息技术部的新法规,世界模型尚未大规模启动。明智驾驶技术的重复速度每天都在变化。从高精度地图和没有地图到去年同意的“端到端”,这是Ear,各种汽车公司试图超越端到端的范式,并找到更好的技术途径。世界基本模型,VLA,世界模型... WEI小岛有各种各样的智能驾驶技术途径,但结束可能是相同的。随着参数的大小的增加,语言逐渐降低了边际收益,并且将在2028年对Internet上所有可用文本的数量进行培训。因此,OpenAI,Google和Meta等巨型技术正在朝着AGI的下一个阶段:多型号大型模型发展。与全球其他AI公司的AI模型。米彭:“使奇迹变得困难并付出巨大的努力”,我做了三件事。在大型语言模型的领域中,规模的定律得到了充分的证明,即“更大的规模,更大的能力”。 Chatgpt的成功基于“使奇迹困难并付出巨大努力”的暴力美学。但是过去,自动驾驶并没有真正使用“大型型号”。 Li Liyun介绍了去年米彭ZHIJIA R&D团队与基本型号的2B(十亿)和7B尺寸保持一致。浏览整个自动化行业,“根据汽车芯片,型号的规模通常在1亿至5亿之间,而主流VLA的参数量表仅约20亿。” Li Liyun说。这是因为基座模型的自主驾驶“更复杂”。它的训练数据比单模式文本数据还要多,但还包括有关物理世界(例如相机信息和导航信息)的多模式数据。本质上,它需要模型来发展理解和理解物理世界。李·利扬(Li Liyun)说,米彭开始促进世界72B超规模的世界参数基础的研究和开发,在主要车辆模型中,这是35倍以上。在形成超级型模型之前,李·利扬(Li Liyun)团队所做的第一件事是:证明量表规模逐渐扩展到量表规则的可行性100亿级。上图左侧的标题是“与模型的大小相比,持久的平均去除误差”,垂直轴为长ADE,水平轴为刻度比例。观察表明,如果用于培训的视频数量仍然是印地语的变化,无论是白线(400万剪辑,400万次视频)还是金线(1400万剪辑,1400万个视频).video)逐渐随着模型参数的上升而逐渐减少,也就是说,误差持续下降;如果比较了两条曲线,则黄金线的崩溃明显大于白线,这意味着用于训练的视频量越大,误差越多。右侧的图片标题为“长ADE vs训练数据集大小”。显然,训练的数据量越大,误差下降的速度就越快。完成验证可行性后,要训练这个超大型模型,木蓬首先要做的就是开发“云模型工厂”。这 ”“云模型工厂”的原材料是数据。小米发现,大量多模式数据和更多的MATSAAS参数的收集为推理链云(COT)的基础世界基础(即,世界基础模型都可以执行复杂的理解理解的推理,因为人们是基于完全理解的范围,并在体景上进行良好的范围。米彭的方法是开发“规则时代的遗产”,成为杀死的第二个武器,例如解决极端情况,例如,在极端情况下,可以避免使用car of Dotaient,但是由于避免了很少的数据,因此可以将其传播到Immunty,但是开车,我汽车侧模型很难知道这种能力。另外,由于汽车模型的小参数,其自身能力的上限很低。 “要研究有点困难,无论他解决一些问题有多困难,他都不太可能提高自己的分数。让一个小型模型知道,学习强化可能不必能够解决这些极端情况。” Li Liyun在“ 21 Auto·首先见自动”中说。但是,如果基本模型足够强大,那么研究强化可以继续刺激能力的上限,改善模型的整体一般情况,未知情况的理解和推理能力,并找到可能降低MGA风险的路径。 “这是所有现场的最新协议。” Liu博士,负责小米世界基础模型。如何进行增强学习? Xiaopeng分享了其增强学习系统发展的三个方面:1。建立REWARD功能。米彭使用最简单的政策作为奖励,例如合规性,舒适性,安全等。奖励模型将为增强研究提供更连续,一般和维度的奖励信息。简而言之,这就是告诉Zhijia“什么好”,让Zhijia找到实现这些表演的方法。在本节中,米彭更加关注明智地删除驾驶和市场反馈数据,从而使模型可以改善市场上的“驾驶习惯”,并提高一般能力。 3。建立模型世界(世界模型)。 Xiaopeng构建的世界模型是一种实时建模和反馈系统。它可以根据动作信号来模仿环境的真实状态,渲染场景并产生场景中其他代理的响应,从而开发闭环反馈网络,这有助于基本模型从“原材料”变为“乘车”,从而依赖“云蒸馏”,它依赖于“云蒸馏”米彭的最后一步是在汽车中放大大型型号。 “云蒸馏”是模型压缩的一种形式,它指的是使用云计算资源让大型模型(教师模型)教授小型模型(学生模型),以模仿大型模型的性能,但大小的尺寸较小,计算量较小。这项技术长期以来一直在今年著名的Deptseek论文中得到验证。刘博士在培训“年轻老师”的培训中实践了基本模型。通过研究加强,他受过培训成为“高级教授”。最后,通过蒸馏,旧教授尽可能保持在汽车末端的能力,从而使小型模型可以吸收大量数据的本质。云端码头模型可以闯入汽车芯片计算能力的“英亩和三点土地”,从而大大增加了“ AI汽车智能上限”。云蒸馏的优势是它可以基于云模型的“小人物和大型智商”生产端侧模型,而十六个人为具有不同需求的汽车定制了不同的“大脑”,从而可以生产具有“成千上万人和数千个面孔”的模型。以前,米彭电动机通过电源安装计算成功地实现了车辆末端的主要模式控制车辆。虽然这只是一个早期测试,但基座模型显示出令人惊讶的驾驶技能。为了习惯如此大型的模型和数据并提高计算速度,米彭电动机于2024年开始建立AI基础架构。现在,它建立了一个10频率的计算功率储备,具有10eeflops的计算动力储备,并以10eeflops的计算功率储备,并以90%以上的时间使用速度,及其上级峰值。为了解决效率不安全数据的问题,米彭电机已经能够团结基础数据基础架构,增加了上传数据的大小22次,并增加了带宽数据。NG培训15次。目前,米彭电动机用于培训的视频数据价值已达到2000万个剪辑,今年将增加到2亿个剪辑。整个“云模型工厂”的旋转平均每5天达到每5天。与Ideal和Nio相比,米彭目前在AI领域具有更广泛的布局,包括AI汽车,AI机器人和飞行汽车,这也是小米需要世界基本模型的原因。他在新闻发布会上宣布了木彭,小米休伊·霍蒂安·陆地航空公司在中国收到了近4,000个订单,将是2026年的弥撒;小米的牛l的人形机器人小规模进入了工厂培训,目的是在2026年进入工业大众劳动。最后,米彭是第一个在2025年底之前实现在中国大陆实施L3智能驾驶的人。理想:从二维到三维,从VLM到VLA到VLA再到技术共享会议,Xiaopeng提及埃德(Ed)他的参数模型是主流VLA模型的35倍,旨在成为Mindv部署这一良好的一年。LA模型竞赛。在明智的驾驶领域,进球是一匹令人眼花thark乱的黑马。去年,端到端成为一波技术,迫使汽车公司从基于规则的模块转变为端到端体系结构。汽车公司最初导致聪明的Pagdrives需要带来巨大的成本;另一方面,一些落后者有机会达到曲线。完美是一个典型的例子。去年,它不仅首先意识到了“公园到停车位”的全部推动,而且许多汽车公司也模仿了独特的“端到端(快速系统) + VLM(慢速系统)”。今年3月,理想发布了一种新的智能驾驶基础模型-Indvla,这非常趋于排除明智的驾驶流程。 VLM就像是一位导师,他指导驾驶员通过语言开车而不是直接干预。 VLA是“教练直接驾驶”,因此,VLA模型推理能力高于由VLM+端到端组成的为期两天的系统。尽管小米和完美的驾驶技术在一般方向有所不同,但凯西将面临许多常见问题。他们如何专门解决它们,他们采用了不同的技术路线:首先,Perfect和Xiaopeng都意识到,过去用于训练端到端模型的数据是大量的二维图形和文本,并且该模型不足以理解3D空间。为此,他们都需要防止基座模型。 ·米彭(Xiaopeng)向模型倒入了大量的相机信息,导航信息和其他有关物理世界的多模式数据,还使用了“云模型工厂”; ·理想选择另一种技术-3D高斯溅出技术,即使用许多高斯“点”来沿着3D对象进行海岸。每个点就像一小滴水,其中包含其自身的位置,颜色和大小。这些高斯点的整合can开发三维图像,使自主驾驶系统可以看到和理解周围的物理环境。其次,他们都意识到,自动驾驶芯片的带宽和计算能力的记忆(例如Orin-X和Thor-U)是有限的,他们应该找到提高模型和功能数量的“键”,同时允许它们实现良好的推理。 ·米彭使用“云蒸馏”汽车技术,即首先训练超大基本模型,然后蒸馏出一个吸收大量数据本质的小型模型,并最终将其部署到汽车中,以最大程度地利用有限的芯片芯片芯片中的模型功能。 ·完全致力于实现模型的稀疏度,采用Moe(与专家)模型架构,并引入广泛的关注。 MUE架构由专门的网络,一个封闭式网络和组合组成。当模型参数超过1000亿时,传统方法将允许所有NE参与每个计算的urons,这是浪费资源;但是,Moe的体系结构将使封闭式网络能够扮演一般调度员的角色,根据要处理的任务激活各种专家,并最终结合了结果,以实现“使用20%的计算资源来完成80%的任务准确性”。分散的注意力是让AI仅计算主要区域的主要区域的重量,例如在开车时提早观看车辆的人。仅使用余辉来扫描后视镜,而不是详细观察所有视图。使用这两种方法,建议确保模型在保持端侧推理效率的同时增长,以便在环境强迫的环境中仍然可以实现良好的推理。第三,小米和理想都应该解决不可避免的问题:“自主驾驶员的自主模型如何复制wi严重的情况”。李的对话强调,完美是一个人工智能公司,这是在外界的沟通和宣传,但他没有在徽标上添加“汽车”。 - 步骤。同时,例如今年7月的第一个纯电动SUV型号理想i8,并将在2026年获得大型型号。Nio:预先安装的硬件和Focus SA安全性。 NIO来自去年7月的NWM智能驾驶计划的发布,没有新的技术建筑新闻。 Ren Shaoqing在Nio技术创新日的去年说,NWM就像“人脑”。 NWM简介后的端到端建筑模型具有三个优点:·了解完整和强大的空间认知能力的信息; ·能够预测下一个情况,将216个可能的轨迹减少到0.1秒,然后找到最佳决定; ·模拟世界NSIM(NIO模拟)可以比较NWM与相应的仿真结果减少的每个轨迹,并提供更多的NWM训练数据,从而使输出更安全,更好。但是,目前,小米和理想使用世界模型来模仿和测试Kansome Smart Driving S橄榄球。驾驶NIO的明智解决方案是否也有时也会继续吗?此外,作为一种多元自回归生成模型,NWM需要进行一十亿或更高的实际数据培训。如何满足如此大的数据需求?除了今天提到的生成模拟测试外,NIO还开发了“集团情报”的魔法武器:Nio当前拥有超过200,000款配备NT2.0平台的型号,并且每辆车都配备了四个Orin-X,其中一种专门用于智能训练。 ORIN-X可以过滤99%的无用数据并通过复杂的自动化过程进行处理,然后将其返回到云中,以便车辆不仅可以通过Smart Feelneh获得有效的数据,而且在明智的驾驶中也可以获取有效的数据:超过200,000辆“移动节点”超过200,000个“移动节点”,每月可以提供500万个+数据提取,并在4500万份中进行研究,并获得了超过100亿库,并获得了10000万次的情况。更多的重要的是,NIO取决于该小组的智能,以显着提高寻找极端情况的能力。 Ren Shaoqing说:“现在,我们拥有超过1000万公里的高价值数据,以确保我们处于试点状态并处于积极和安全的状态。”小米事故发生后,监管机构在明智的驾驶中行驶了刹车进行比赛。玩家渴望显示他们支付“安全学费”浪潮所需的参数和速度。尽管它比小米慢,并且对模型建筑和大规模生产推动的呼吸速度慢,但Nio驾驶专家说“ 21 Auto·Auto”,Li Bin审查了用户每周报告的重要事故。他对智能驾驶团队的期望非常明确,“自由能源并减少事故”。 NIO的速度很慢,一直具有安全性的重要性:去年7月,为用户启动了端到端的体系结构功能,范围增加了6.7倍。推动后,它有帮助ED用户每月避免发生70,000次事故;今年1月,Nio通过Banyan 3.1.0系统推动了AES功能,这使其成为世界上第一个将端到端技术应用于主动安全的汽车公司。小米的驾驶事故提醒您,迫使该行业离开竞争,参加“快速运行”到“连续跑步”的竞争。目前,在随后的驾驶比赛中可能不会重新吸引NIO的NIO。 Wei Xiaoli在大型AI模型中的竞争反映了他们任务的背景-Xiaopeng是“技术控制”,是最受欢迎的,并且敢于每年投资45亿元人民币;仔细支出的理想仍然集中在汽车终端的实际经验上。 Weilai,“汽车圈中的Haidilao”已提前为用户提出了安全硬件。在电气化过程中,魏小尔的最大对手是特斯拉。但是面对人工智能革命,越来越多的技术巨头联手了,他们已经运行最快。