当大模型开始从云端走向手机、汽车等终端设备,一个此前被高速发展掩盖的矛盾正逐渐浮出水面,芯片算力在不断膨胀,算法团队在疯狂扩参数,但这两样东西凑在一起时,实际效能却大打折扣。一台搭载了顶级芯片的车,理论算力充足,真跑起来却发现芯片在“等数据”,算法在“等资源”,彼此空转。这种“软硬割裂”带来的效率损耗,让延续多年的“堆料”模式走到了尽头,正在成为AI进一步落地的隐形路障。
近日,理想汽车联合国创决策智能技术研究所,对外公布了端侧大模型“软硬协同设计定律”。这并非一款新的产品功能,而是一套试图从数学底层重新定义芯片与算法关系的理论框架。
![]()
“暴力堆算力”正在面临物理极限
在智能辅助驾驶迈向更高阶的阶段,行业正面临一个核心悖论。以大语言模型为基础的视觉-语言-行动(VLA)模型,确实需要更强的认知能力;但车载环境对功耗、散热和成本的严苛要求,决定了车企不可能为了算力无限堆砌硬件。换言之,竞争的制高点正在从“谁的芯片算力更强”转向“谁的真实效率更高”。
英伟达、苹果、微软、谷歌等全球科技巨头早已关注到这一挑战,软硬件之间的“协同设计”(Co-design)正在成为行业共同探索的研发范式。
理想的研发团队在实际部署中感知到了这种“软硬割裂”。在上一代英伟达Orin/Thor这类车载平台上,他们也发现一个普遍现象:芯片的理论峰值性能很强大,但实际部署大模型时,精心设计的模型架构往往无法完全调用硬件特性,而为了适配硬件做出的调整,又可能折损模型的智能表现。这种“芯片峰值性能≠实际系统效能”的困境,指向了一个深层次问题,芯片遵循摩尔定律线性增长,算法则是指数级扩张,两者的演进节奏产生错位。
![]()
把软硬协同从理念变成数学表达范式
为了解决这一错位,理想汽车基座模型MindVLA团队与国创决策智能技术研究所联合研发的“硬件协同设计扩展定律”,首次尝试将这种复杂的协同关系转化为一套可量化、可预测的数学框架。
这套框架的核心思路在于“建模”。团队通过训练170个不同架构的模型、评估近2000个候选配置,将Transformer架构的精度表现与模型架构进行了多项式拟合,找到了潜在表达式。同时,他们将计算机体系结构领域的经典Roofline模型引入车载场景,系统建模了KV缓存、MoE路由、注意力机制等大模型特有负载对芯片内存子系统的影响。
基于这两大建模,团队开发了PLAS(帕累托最优LLM架构搜索)框架。这一框架的作用是给定芯片的硬件参数(算力、带宽、缓存)和工程约束(延迟、功耗),自动生成最优的模型架构方案。
这套数学工具的落地效果是直接的。以往升级芯片或更新模型时,研发团队需要耗费数月进行模型选型和适配;而依据这一定律,模型设计和选型周期理论上可以缩短至一周以内。更重要的是,它证明了智能的提升不必绑定算力的线性增长,通过软硬件的深度协同,同样可以实现系统能效的跨越式提升。
![]()
破解芯片设计的“黑盒”,六大发现改写游戏规则
这套数学框架在实际研发中沉淀出的结论,正在反向定义下一代芯片的模样。研究团队发现,未来的车载智能芯片不能再一味追求理论算力的攀升,而必须重新审视架构设计的底层逻辑。稀疏计算将成为车载场景的标配,大模型在推理时不需要激活所有参数,芯片必须学会“挑着算”,只调用必要的神经元;同时,内存带宽和缓存效率往往比单纯的算力TOPS数字更能决定实际性能。此外,大模型在理解指令和生成答案两个阶段对硬件资源的需求截然不同,这意味着芯片需要具备“动态变脸”的能力,在不同阶段灵活调配算力。
另一方面,一些延续多年的传统设计惯例正在被打破。Transformer架构中固定的4倍扩展比在车载场景下被证明是低效的,芯片的运算单元配比需要更灵活的方案。INT8量化理论上能带来2倍加速,实际却只能实现1.3到1.6倍,问题出在非线性算子和精度转换的开销上,下一代芯片必须在指令集和运算单元层面原生支持混合精度计算和算子融合。这些发现表明没有通用的万能芯片,只有针对特定算法场景深度优化的专属芯片。算法定义芯片,正在从一句口号变成硬性的设计准则。
![]()
从理论到量产,一套公式背后的硬核家底
端侧大模型“软硬协同设计定律”的发布,对理想汽车而言,不仅是一篇学术成果的总结,更体现其在智能辅助驾驶技术栈上层应用到底层芯片的完整闭环。而支撑这一闭环的,是近8年累计近500亿元的研发投入——这个数字在新势力车企中稳居前列。仅2025年一年,理想的研发投入预计就达到120亿元,其中约60亿元流向了人工智能领域。
真金白银的投入换来了扎实的学术积累。从2021年至今,理想围绕BEV、端到端、VLA、世界模型等前沿方向,累计发表了近50篇论文,被学术界引用超过2500次,其中32篇登上了顶级学术会议的舞台。这种“研究驱动研发”的模式,让理想从用户需求的响应者,逐渐转变为技术规则的参与制定者。
而这套理论最直接的工程产物,就是理想自研的智能辅助驾驶芯片“马赫100”。这款采用5纳米制程的车规级芯片,正是“软硬协同设计定律”从纸面走向现实的第一次完整验证。它将首次搭载于全新一代理想L9(参数丨图片)之上,两颗马赫100组成的双芯片系统,总算力达到2560TOPS,但更关键的是其“有效算力”,单颗马赫100的有效算力是英伟达Thor-U芯片的3倍。
![]()
正如理想汽车董事长兼CEO李想在此前的AI Talk中所言:“任何时候当我们想去改变和提升能力,第一步一定是搞研究”。当行业还在比拼谁家的芯片“看起来更猛”时,理想汽车已经开始用一套数学公式,把智能辅助驾驶的竞争从“堆料游戏”拉回了“效率战争”。这一定律的发表和应用,也展现出以理想为代表的中国企业正在从产品创新的“跟随者”向技术标准的“定义者”转变,成为全球AI浪潮中的硬核玩家与行业领航者。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.