网易首页 > 网易号 > 正文 申请入驻

手机跑100亿参数大模型,高通把AI塞进你口袋

0
分享至


3月27日,CFMS|MemoryS 2026峰会在深圳举办。这场以"穿越周期,释放价值"为主题的聚会,把存储、芯片、AI大模型和汽车产业链的人凑到了一张桌上。高通公司AI产品技术中国区负责人万卫星在现场抛出一个判断:个人AI将始于端侧,我们正在迈向以AI和用户为中心的多终端体验。

万卫星把AI在行业应用的演进划了四个阶段。第一阶段是感知AI,语音降噪、图像识别这些已经烂大街了,手机计算摄影就是典型例子。第二阶段是生成式AI,ChatGPT、文生图模型都属于这类,需要大量数据预训练,在有监督环境下解决问题。第三阶段是智能体AI,跟前者的关键区别在于能在无监督状态下自主理解用户意图、行动决策,处理更复杂的任务。第四阶段是物理AI,让AI理解真实物理世界的规则并反馈输出,目前还在早期探索。

行业现在的注意力主要集中在第二和第三阶段。万卫星分享了一组端侧生成式AI的演进数据:三年前端侧上下文长度普遍只有1k-2k,两年前扩展到2k-4k,去年在高通与合作伙伴的探索中已提升到4k-8k,特定场景甚至能支持32k-128k。上下文越长,对KV缓存的需求越大,内存容量和带宽的压力也就越重。


模型参数方面,手机已能运行10亿到100亿参数级别的大模型,PC支持130亿到200亿,车载场景可达200-600亿。AR眼镜和低功耗设备也能让10亿-40亿参数的模型完全在端侧运行。去年9月的骁龙峰会上,高通还展示了与合作伙伴将50亿参数的全模态模型完整跑在端侧,用户可以用自然语言直接交互。

端侧部署的优势很实在:个人数据就在本地,源头推理既自然又保护隐私;不用联网,随时随地可用;成本也更低。但挑战同样具体——内存规模设定了模型大小的天花板,而模型大小又决定了AI能力的上限;内存带宽限制会影响token输出速度,拖慢用户体验;手机这类高集成度设备还要严防AI推理触发温控、导致发热。在内存、带宽、性能和能效之间找平衡,是高通和产业链伙伴一直在啃的硬骨头。

智能体AI的趋势指向三个方向:更低时延、更好个性化、持续无感的用户体验;从统一模型走向任务专业化,通过多智能体框架解决问题;从简单的对话语音助手进化成真正懂用户意图、上下文和感知信息的AI助手。


万卫星把智能体比作一个持续运行的闭环系统,包含感知、理解、推理、记忆、工具、执行等多个模块。这些模块整合后,智能体能理解用户意图、拆解任务并独立完成。更重要的是,终端侧智能体可以提供持续感知、持续思考、持续行动的体验。

高通过去两年一直在讲"AI是新的UI"。未来用户不再围绕单个APP或功能做交互,而是用语音或文本与智能体自然对话,由智能体理解意图、规划任务,再调用端侧大模型或云端通用大模型来完成。个人AI将从"以手机为中心"转向"以AI和用户为中心",AI不再绑定具体设备,而是通过多设备灵活协同完成任务。

万卫星强调,个人AI始于终端侧,因为终端离用户最近、拥有全部用户信息,能第一时间感知意图、上下文和偏好。但它并非孤立运行,而是通过混合AI架构在终端侧、本地边缘、网络边缘和中央云之间协同。高通去年发布的第五代骁龙8至尊版移动平台、骁龙X2 Elite计算平台等产品,以及今年MWC亮相的基于AI200和AI250芯片的数据中心加速卡,都是这套布局的落子。

从手机、耳机、可穿戴设备、PC,到汽车、机器人、数据中心,高通试图用统一的AI架构贯穿所有产品线。万卫星的总结很直接:核心在于通过统一技术路线,提供高性能、高能效的软硬件底座,让AI能力从单颗芯片扩展为跨终端、跨场景的平台级能力。

峰会期间,高通因将业务从智能手机扩展至个人AI、智能可穿戴设备、PC、汽车、边缘网络及工业物联网等广泛边缘领域,推动AI在万物互联终端实现低延迟、高安全的本地化落地,获颁"年度AI生态杰出贡献奖"。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普:伊朗政权已更迭,将放行20艘油轮!伊朗副总统:将重塑霍尔木兹海峡管理制度

特朗普:伊朗政权已更迭,将放行20艘油轮!伊朗副总统:将重塑霍尔木兹海峡管理制度

红星新闻
2026-03-30 13:21:16
重庆一高校多名贫困生兼职送外卖被处分,最新进展:校方中止处分流程,未实际处罚

重庆一高校多名贫困生兼职送外卖被处分,最新进展:校方中止处分流程,未实际处罚

湖南法治报
2026-03-30 14:47:57
美被曝正讨论派军进入伊朗提取约450公斤高浓缩铀

美被曝正讨论派军进入伊朗提取约450公斤高浓缩铀

界面新闻
2026-03-30 20:29:31
想跑跑不了,特朗普失控

想跑跑不了,特朗普失控

南风窗
2026-03-30 15:11:57
财务自由后的感觉是怎样?网友讲述实际体验 感叹只有羡慕的份

财务自由后的感觉是怎样?网友讲述实际体验 感叹只有羡慕的份

侃神评故事
2026-03-24 18:00:10
马塞洛16岁儿子出彩:穿裆+补射 35分钟戴帽!皇马U19狂胜

马塞洛16岁儿子出彩:穿裆+补射 35分钟戴帽!皇马U19狂胜

叶青足球世界
2026-03-30 19:11:57
于东来婉拒市长饭局!

于东来婉拒市长饭局!

李万卿
2026-03-30 14:42:16
米莱高调宣布:我将阿根廷的贫困率降低了27%,全靠尊重产权和市场经济

米莱高调宣布:我将阿根廷的贫困率降低了27%,全靠尊重产权和市场经济

风向观察
2026-03-30 14:33:04
我49岁,已3年不跟父母联系,不是不孝,是他们要的太多我给不起

我49岁,已3年不跟父母联系,不是不孝,是他们要的太多我给不起

施工员小天哥
2026-03-29 19:50:20
杭州市城市建设投资集团有限公司党委书记李红良接受审查调查

杭州市城市建设投资集团有限公司党委书记李红良接受审查调查

界面新闻
2026-03-30 17:01:47
单依纯发长文致歉“错误全在我”, 李荣浩:不要赔偿,早点休息

单依纯发长文致歉“错误全在我”, 李荣浩:不要赔偿,早点休息

韩小娱
2026-03-30 05:40:11
“希望大家不要再骂我了!”全红婵哽咽落泪:饿到不行,体重还是减不下来

“希望大家不要再骂我了!”全红婵哽咽落泪:饿到不行,体重还是减不下来

海峡网
2026-03-30 17:13:37
高盛:市场悲观情绪接近极限 一旦战争局势降温股市或大幅反弹

高盛:市场悲观情绪接近极限 一旦战争局势降温股市或大幅反弹

财联社
2026-03-30 18:45:05
广东通报:李禾根被查

广东通报:李禾根被查

南方都市报
2026-03-30 17:27:29
惊讶!伊朗大捷!用一场标志性大胜,让美军创下战后最大战损记录

惊讶!伊朗大捷!用一场标志性大胜,让美军创下战后最大战损记录

军机Talk
2026-03-30 11:02:14
张雪峰生前生日照被扒,黑底白字,还有一张黑白照片前放着香炉

张雪峰生前生日照被扒,黑底白字,还有一张黑白照片前放着香炉

魔都姐姐杂谈
2026-03-30 19:37:17
单依纯的尴尬不在于翻唱,而是无歌可唱

单依纯的尴尬不在于翻唱,而是无歌可唱

牛角说
2026-03-30 12:41:23
贾跃亭晒喜讯:儿子圆梦斯坦福大学研究生 为他骄傲

贾跃亭晒喜讯:儿子圆梦斯坦福大学研究生 为他骄傲

快科技
2026-03-30 09:40:20
张雪峰办公室 “诡异” 一角引热议!黑白照 + 香炉 网友:不吉利

张雪峰办公室 “诡异” 一角引热议!黑白照 + 香炉 网友:不吉利

魔都姐姐杂谈
2026-03-30 19:57:02
殡葬新规3月30日起实施 新规明确不全面禁止土葬

殡葬新规3月30日起实施 新规明确不全面禁止土葬

闪电新闻
2026-03-30 11:46:27
2026-03-30 21:23:00
像素与芯片
像素与芯片
有态度网友ytd
760文章数 2关注度
往期回顾 全部

科技要闻

一句谎言引发的硅谷血案

头条要闻

中国向能源紧缺的东南亚国家出口柴油等燃料 官方回应

头条要闻

中国向能源紧缺的东南亚国家出口柴油等燃料 官方回应

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

本轮地缘冲突,A股凭什么走出独立行情

汽车要闻

限时12.58万起 银河星耀8远航家系列上市

态度原创

时尚
数码
旅游
家居
手机

衣服买对不买贵,有气质的女性都爱这些穿搭,简单又显身材

数码要闻

三星Buds4 Pro评测:全能交互+沉浸式音质,安卓旗舰耳机新标杆

旅游要闻

怒江上罕见“双虹凌空”,它就是永昌古驿道保存最好的双孔铁索桥

家居要闻

东方法式美学 现代简约

手机要闻

vivo推出Y500s手机:骁龙4 Gen 2,1799元起

无障碍浏览 进入关怀版