北京时间2025年9月24日,2025骁龙峰会•中国专场媒体群访中,高通技术公司高级副总裁兼手机业务总经理Chris Patrick与产品市场高级总监马晓民,围绕第五代骁龙8至尊版的技术设计、行业竞争应对及生态布局,阐述了高通在移动平台领域的战略逻辑。作为年度旗舰,该平台已获OEM厂商积极反馈,其「不唯参数、聚焦体验」的路径,也为移动行业提供了新参考。
靠微架构与精细调优,摆脱频率依赖
针对“CPU频率提升有限但性能显著增强”的疑问,高通团队从自研架构迭代与细节优化两方面给出解答。
Chris Patrick梳理了自研CPU的技术脉络:“去年发布的骁龙8至尊版,是我们首次将自研CPU引入到移动平台”,而第五代骁龙8至尊版搭载的是“第三代自研CPU,用在移动平台上的第二代”。经过上一代实践,团队在微架构层面改进和电源管理提升上积累了经验,所有优化都集中于一个目标:真正为移动平台的独特需求和SoC进行深度优化,其中移动终端的散热、续航限制,决定了单纯堆频率不可持续,针对性的架构调整才是关键。
马晓民进一步补充性能释放的细节:“绝对性能只是CPU优化方向的一部分,而我们更关心的是它能不能持续地发挥性能”。新芯片的CPU单核IPC(每时钟周期指令数)曲线比上一代明显要好,长时间运行仍能稳定输出;同时,CPU产品里的SME硬件模块对于跑分有帮助,且这一代产品相比上一代的频点数更多,能针对游戏、多任务等场景更细致地调优,最终实现以更小的投入,换得更好的性能。
在SME指令集生态上,Chris Patrick透露:“我们与友商采用的方案有所不同”,虽需更多生态适配努力,但他同时表示:“有合作伙伴反馈,我们的SME1性能实际上已显著超越了友商的SME2”,这一突破让硬件优势得以真正落地到应用层面。
GPU策略以真实体验为核心 聚焦4W核心场景
面对“骁龙GPU峰值性能不及竞争对手”的提问,高通团队明确「以真实体验为核心」的逻辑,并用技术细节佐证。
Chris Patrick指出行业趋势:“传统的、现有的基准测试,与真实游戏表现和用户体验的相关性正变得越来越低”。今年推出的Qualcomm Adreno独立高速显存(HPM)技术,虽对跑分有一定影响,但对GPU在真实游戏中的使用体验收益更显著,目前已有数款游戏适配,总线和DDR的数据传输吞吐量大幅提升,整体帧率和流畅度显著提升,Chris Patrick表示,“因此我们的关注重点是真实游戏中的性能表现,而非GPU基准测试分数”。
马晓民也用数据强化了这一观点:“如果去看GPU曲线,可以发现几乎都用在4W的地方,这也是大多数游戏场景、甚至一些AI使用到GPU的场景”;而“十几瓦的峰值性能,实际是用不到的”。显然,高通的策略是把4W范围内的性能跟功耗平衡做到极致,让用户在日常使用中既能享受到流畅,又无需担心续航损耗。
端侧AI从“演示”到“常态”,需突破技术与场景门槛
当前端侧AI面临“演示多、实用少”的困境,高通团队从硬件设计与落地路径两方面给出破局思路。
在硬件层面,Chris Patrick强调前瞻性设计:“我们在AI方面的研究已经持续二十多年,并且一直和学界保持非常紧密的联系,全新NPU的设计秉持着面向未来的思路,面向未来会出现的模型类型、底层模型技术以及不同比特数字格式”。此前高通率先在边缘侧运行Stable Diffusion和Image Generation,正是这种设计的实践成果。
针对可穿戴设备的AI需求,他提到“安蒙在演讲中也有提到,我们的核心思考在于如何将分布式AI技术部署到不同终端中”。高通拥有从智能手表、耳塞到手机的全产品线,当前重点研究“如何在这些产品间合理分配计算资源”,比如眼镜负责视觉采集、手机承担复杂推理,通过「轻量化前端+高性能后端」的协同平衡功耗与精度。
马晓民则总结了端侧AI落地的五大核心要求:“要在手机端成功部署,第一是每秒能处理的Token数要足够高”,避免输出缓慢;第二需“保持足够低的功耗”,防止续航崩溃;第三要“保证私人重要的东西在手机内部”,确保安全;第四需“内存开销足够小”,控制成本;第五是“准确性要足够高”,否则用户会放弃使用。为满足这些要求,高通通过“最先进的解码算法”“量化功能”,实现“更低的功耗、更快的Token速度、更隐私、更安全”。
谈及“智能体AI”,马晓民认为第一步是打造私人化助手,他表示大多数消费者更希望看到它是私人化助手,需基于手机NPU和传感器中枢,实时感知各种运动、对话,进行信息收集和训练,最终以非常低的功耗实时提醒用户在什么场景需要什么行动,在马晓民看来,这才是AI智能体真正实现的第一步。
在云端与端侧的关系上,Chris Patrick表示二者是协同而非对立,目前,云端在处理复杂的大规模方面仍具明显优势,部分应用会先在云端开发;但随着量化技术持续突破,混合专家等新型模型出现,部分处理在边缘侧完成以提升速度,最终大规模推理在云端进行的混合模式将成主流,今年及未来几年,会有越来越多的AI能力迁移至边缘终端。端侧的独特优势在于能及时获取身边的数据,比如手机知道用户下午两点有会议且刚踢完足球,会建议预留更多时间换衣,提供更具情境性的判断。
内存架构系统级优化,支撑大模型端侧运行
内存是大模型推理的核心支撑,马晓民将第五代骁龙8至尊版的内存设计定义为「系统工程」,从全维度提升效率。
他首先澄清内存的广义概念:“内存本身是一个比较宽泛的概念。大家通常会把DDR称为内存,但如果从整个系统角度来看,里面的缓存也算是内存的一部分”。他提到当前平台采用64位内存架构,完全能够支持所需的内存容量;同时,高通持续向更低比特率的量化推进,让手机运行较大模型时既能有效控制内存开销,又不会牺牲其精度。
核心策略是“尽可能减少对外部内存的访问,优先访问高效的片上内存”,比如系统级缓存(SLC)、Adreno HPM高速显存——“非必要情况下避免使用外部内存,能有效降低功耗和时延”。仅在“大模型运行中不可避免的数据搬运、必须访问DDR的场景”,才会调用外部内存,且通过量化算法“确保这些场景下的内存开销最小化”。
视频创作生态以APV编解码器为核心 打造开放体系
针对高级视频编码的布局,Chris Patrick介绍,高通支持高级专业视频编解码器(APV)的核心目的,是满足创作者在开始剪辑之前获得最高质量原始素材的需求。目前软件生态已见进展,Chris Patrick表示,DaVinci Resolve将支持高通提供的APV,作为专业剪辑工具,其支持让创作者可直接用手机完成“拍摄-剪辑”的专业流程。
与友商封闭生态不同,高通的目标是“赋能一个更加开放的生态”,他提到:“友商主要在其自有生态内运作,而我们已有多家公司参与,期待形成健康的生态体系,最终为创作者提供最佳的体验,通过开放合作降低专业创作的设备门槛。”
基准测试回归场景 微架构优于制程堆砌
关于基准测试,Chris Patrick认为:“分数不可能是完美的,跑分结果永远无法代表终端用户真正的需求”,但它仍是“与消费者直观沟通的方式”。他特别肯定中国市场的引领性,通过实际负载(如游戏)而非单纯的GPU基准测试评估性能。同时Chris Patrick肯定的表示,中国市场在此领域始终处于领先地位。
马晓民补充:“基准测试结果仅衡量部分使用场景,无法体现SoC带来的丰富体验”,比如连接性、续航等维度都难以覆盖,因此建议用户“了解基准测试的具体测量内容,以及与真实场景的相关性”。以去年引入的Speedometer基准测试为例,其基于WebView引擎,能反映国内主流应用的运行速度,今年该平台的Speedometer分数大幅提升,且高通正与厂商合作,拆分视频、游戏等场景的CPU功耗占比,让优化效果更直观。
在制程工艺上,Chris Patrick强调:“每一年,我们都需要审慎决策,选择合适的制程工艺,找到性能和能效的最佳平衡”,核心是“SoC层面的微架构调整”,比如CPU的IPC优化、GPU的HPM技术。同时,他也明确道:“今年制程是小幅提升,但微架构有大幅改进。至于明年2nm,需结合当时的模型需求、功耗目标判断,当前重点是把第五代骁龙8至尊版的体验做好”。
第五代骁龙8至尊版的技术布局,体现了高通从「参数竞赛」向「体验驱动」的转变:CPU的精细调优、GPU的场景化设计、端侧AI的落地导向、内存的系统级优化,以及视频生态的开放赋能,均围绕用户需求展开。随着端侧AI进入多模态关键期,开放生态逐步成型,移动终端或将迈入「体验为王」的新阶段。
