网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

工程师把模型塞进手机后，账单来了

2026-05-01 00:13:13　来源: 像素与芯片

北京举报

0

分享至

凌晨两点，一位嵌入式工程师终于把7B参数的模型跑进了手机。他以为战斗结束了——直到看到电费单。

这张图藏着所有秘密

原文用一张对比图拆穿了行业幻觉：云端大模型（大语言模型） vs 端侧小模型（小型语言模型），成本曲线在何时交叉？

X轴是查询量，Y轴是累计成本。云端起点低但斜率陡峭，端侧起点高却趋于平缓。交叉点通常在日均百万次查询附近——但大多数边缘设备永远到不了这个数。

硬件成本被严重低估

高通骁龙8 Gen 3的神经网络处理单元（NPU）算力够强，可单价让批量生产的物联网厂商倒吸凉气。更隐蔽的是散热：持续推理让设备温度飙升，降频后实际吞吐量只剩标称值的60%。

原文算了一笔账：一台边缘网关7×24小时跑3B模型，三年总拥有成本（TCO）反而比调用云端API贵17%。这还没算工程师为量化压缩（Quantization）和内存优化掉的头发。

延迟陷阱与隐私幻觉

「本地推理零延迟」是伪命题。首次加载模型进内存的冷启动时间，在低端ARM芯片上能飙到8秒——足够用户关掉App给个一星差评。

隐私优势也被过度营销。原文指出：多数端侧方案仍需回传匿名化日志做模型更新，数据终究要出设备。真正的联邦学习（Federated Learning）部署成本，又绕回了那张成本曲线图。

谁在假装看不见？

芯片厂商爱讲「每瓦特算力」，云厂商鼓吹「混合架构」，中间夹着算不清账的产品经理。原文的工程师最后把模型砍到了1.5B，精度损失4%，但总算让CFO在会议上点了头。

所以问题变成：当你的设备日活从10万掉到1万，那张成本曲线图会怎么变形？有人愿意公开自己的真实数字吗？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

芯桥半导体张鑫：从单点智能到群体协同，芯桥如何打造具身智能的“算力工厂”

智东西 2026-04-29 11:38:49
0 跟贴 0
硬核拆解：GPT-5、Claude和Gemini是如何训练和推理的？

华尔街见闻官方 2026-04-30 11:17:51
0 跟贴 0

伊朗战争点燃PGMEA供应危机，全球AI芯片又一个“卡脖子”时刻？

华尔街见闻官方 2026-04-29 15:40:43
0 跟贴 0

北大团队提出 SHINE：任意文本转化大模型 LoRA，仅一次前向传播

机器之心Pro 2026-03-23 15:46:38
0 跟贴 0
48岁的资深工程师被公司无故裁员，并且不给赔偿，他没有闹

漂流的故事集 2026-04-29 10:07:37
0 跟贴 0

大姐看手机太入迷，男子悄悄顺走背包，凭空消失也太纳闷！

青青笑翻天 2026-04-29 11:14:36
1 跟贴 1

手机不要和四样东西放一起，打死也要牢记，避免用时没反应！

豆豆尬笑 2026-04-29 09:46:59
3 跟贴 3
Sakana AI造了个数字生命「培养皿」，AI学会打架、结盟、抢地盘

机器之心Pro 2025-11-05 13:58:14
0 跟贴 0

让人难以置信！工程师竟然在悬崖峭壁上，修建道路

米高没搞笑 2026-04-30 16:36:44
1 跟贴 1
女子五一出游坐动车，手机靠在窗边随便录了一段，一个男孩默默从镜头里走过去

乐动向前 2026-04-30 17:11:10
0 跟贴 0
手机被偷，为讨公道却被抓，美国警察的做法是否正确

业健影视 2026-04-29 12:07:41
1 跟贴 1
10万引普林斯顿刘壮最新访谈：架构没那么重要，数据才是王道

量子位 2026-04-29 12:17:01
2 跟贴 2
四川小伙做的导弹车模型，准备开出去测试，结果被拉走了！

星君搞笑怪 2026-04-29 16:01:55
12 跟贴 12
紧急抢修光缆，损失大了

杰克大魔王影视 2026-04-29 14:54:19
1 跟贴 1
初中生儿子放假手机不离手，好言劝说教育不听，严父只能被迫出场

柯比时尚说 2026-04-29 10:14:36
0 跟贴 0
男孩私买手机，被父亲拎皮带当众抽打，店主：外形难分辨未成年

政法频道 2026-04-30 18:38:51
5 跟贴 5
听到一个痛心的消息老年人值得注意大家要引以为戒

崩坏星穹铁道 2026-04-30 09:42:44
0 跟贴 0
大模型创业公司，为什么越来越多在往“小”做？

虎嗅APP 2026-04-30 23:05:24
0 跟贴 0
HappyHorse没有惊喜

36氪 2026-04-30 17:23:30
4 跟贴 4
52年前的理论上车：揭秘理想马赫100与数据流架构

HiEV 2026-04-30 10:08:37
3 跟贴 3
男子家门口玩手机被狗子背后“偷袭”

小火柴视频 2026-04-28 11:31:15
19 跟贴 19
上海迪士尼回应游客劝阻吸烟被打：园区没有禁烟；被打男子发声：对方已赔钱和解

中国新闻周刊 2026-04-27 14:25:00
15229 跟贴 15229
GPU神话松动，AI真正的战场变了

虎嗅APP 2026-05-01 01:19:11
0 跟贴 0
男子看路边有人收旧手机，没想到用旧手机可以换鸭子

教育第1线 2026-04-29 14:25:31
15 跟贴 15
女子拍屋顶裂缝取证，刚举手机屋顶直接坍塌，网友：没录像可就百口莫辩了

星沙时报 2026-04-30 11:06:49
0 跟贴 0
4名女孩挤一辆共享电动车金发女孩坐在车篮上玩手机

火炼树 2026-04-29 20:29:47
0 跟贴 0
看车不看路，低头看手机，亲人泪两行！

皮皮流鼻涕 2026-04-29 16:21:16
1 跟贴 1
老板在店里理货上架，不小心把手机当商品给补进去了，网友：顾客收到货都得愣一下

乐动向前 2026-04-29 20:02:06
0 跟贴 0
π0.7的泛化能力有多强？零样本纯靠口述就能用空气炸锅

DeepTech深科技 2026-04-17 21:34:56
0 跟贴 0
谷歌把Gemini塞进400万辆车：车载AI终于不再智障了

摸鱼算法 2026-05-01 02:40:01
0 跟贴 0
帮车企卖好车，帮商家降本增效：拆解轻舟智航的商业闭环 | 智车星球

智车星球 2026-04-29 19:33:00
0 跟贴 0
开车像有个贴心管家！座舱能感知情绪，还能帮你找车位缴费

军科零零 2026-04-30 01:08:42
0 跟贴 0
谷歌给老车换大脑：语音助手4月30日上车

硅屿手记 2026-05-01 04:05:16
0 跟贴 0
就是这位国际教授！认真推荐他的两本书以及顶级思维模型

湛庐阅读 2026-04-29 21:47:28
0 跟贴 0
美国女子故宫游玩手机遗失被环卫工捡到归还喜极而泣

星晨视频 2026-04-29 21:54:55
8 跟贴 8
美军研究对伊朗新作战方案，拟在霍尔木兹海峡动态打击

一饮山河 2026-04-28 17:55:33
0 跟贴 0
女子称充电时玩手机遭电击

点时新闻 2026-04-29 16:11:11
0 跟贴 0
云端医生与数字地图共同护航，深喀“五分钟社会救援圈”帮患者“救下心梗”

人民日报健康客户端 2026-04-30 15:50:34
0 跟贴 0
浙江男子花860万买了套排屋，收房时傻眼，院子里有一个“凸起”，业主：跟老家的厕所一样，开放商：不利因素已公示

极目新闻 2026-04-30 10:33:16
7385 跟贴 7385
男子骑车把手机放支架上，没想到手机突然掉了

重庆城市TV 2026-04-28 16:51:26
1 跟贴 1

40岁英格兰传奇宣布退役！结束23年生涯，曾任曼联队长+率队夺6冠

40岁英格兰传奇宣布退役！结束23年生涯，曾任曼联队长+率队夺6冠

我爱英超

2026-04-30 17:27:22

王石“裸泳”再登热搜！网友：身体非常好了，精气神儿不输小年轻

王石“裸泳”再登热搜！网友：身体非常好了，精气神儿不输小年轻

火山詩话

2026-04-30 10:27:30

央视怒批哪吒破产，百亿国资被霍霍精光

央视怒批哪吒破产，百亿国资被霍霍精光

新浪财经

2026-04-30 10:08:50

网红“罗二哥”去世，年仅47岁，岳父5天前刚去世，原因令人惋惜

网红“罗二哥”去世，年仅47岁，岳父5天前刚去世，原因令人惋惜

180视角

2026-04-30 13:22:07

珠海风云，千亿国资帝国亏空迷局

珠海风云，千亿国资帝国亏空迷局

栗滴财经

2026-04-30 18:22:14

从0-4到6-0逆转世界第一：22岁兰州选手距世锦赛决赛仅一步之遥

从0-4到6-0逆转世界第一：22岁兰州选手距世锦赛决赛仅一步之遥

竞技风云录

2026-04-30 19:23:07

央视转播半决赛1阶段：吴宜泽vs艾伦，33局17胜，2人均未进过决赛

央视转播半决赛1阶段：吴宜泽vs艾伦，33局17胜，2人均未进过决赛

宝哥精彩赛事

2026-05-01 00:20:22

爆冷！0-1！点球改变战局，埃梅里不敢相信，欧战晋级前景恶化

爆冷！0-1！点球改变战局，埃梅里不敢相信，欧战晋级前景恶化

足球狗说

2026-05-01 04:52:37

济南夏雨荷事件，原来文旅两任领导都是满族，公司名起得也很奇怪

济南夏雨荷事件，原来文旅两任领导都是满族，公司名起得也很奇怪

魔都姐姐杂谈

2026-04-30 13:02:58

太阳队传闻：狄龙·布鲁克斯或将面临1.25亿美元的续约大礼

太阳队传闻：狄龙·布鲁克斯或将面临1.25亿美元的续约大礼

好火子

2026-05-01 04:38:09

提醒所有人！5月开始，慢特病证一定要办，否则看病买药全自费

提醒所有人！5月开始，慢特病证一定要办，否则看病买药全自费

阿芒娱乐说

2026-04-30 18:04:06

他们说的话，我连标点符号都不信

他们说的话，我连标点符号都不信

胖胖说他不胖

2026-04-30 17:31:31

陕西男子3次报警，民警拒不派警，致两家四口被杀，法院咋判的？

陕西男子3次报警，民警拒不派警，致两家四口被杀，法院咋判的？

就一点

2026-04-29 17:28:35

正部级易会满被“双开”：贯彻落实党中央关于资本市场重大决策部署阳奉阴违、推诿卸责

正部级易会满被“双开”：贯彻落实党中央关于资本市场重大决策部署阳奉阴违、推诿卸责

界面新闻

2026-04-30 17:18:06

王毅同美国国务卿鲁比奥通电话

新华社

2026-04-30 22:46:33

一女子举报身为公职人员的前男友索贿当事人称系借款纪委监委已展开调查

一女子举报身为公职人员的前男友索贿当事人称系借款纪委监委已展开调查

红星新闻

2026-04-30 15:20:27

伊朗最高领袖，“最详细伤情”披露

伊朗最高领袖，“最详细伤情”披露

中国新闻周刊

2026-04-30 16:23:05

俄军遭遇黑色滑铁卢：单日死伤1470人，119门重炮遭摧毁

俄军遭遇黑色滑铁卢：单日死伤1470人，119门重炮遭摧毁

史政先锋

2026-04-30 21:15:32

北京协和医学院博士：千万不要把烦死了、累死了、气死了挂在嘴上

北京协和医学院博士：千万不要把烦死了、累死了、气死了挂在嘴上

洞见

2026-04-30 09:25:41

巡察组刚进驻，格力集团原董事长主动投案

巡察组刚进驻，格力集团原董事长主动投案

中国新闻周刊

2026-04-30 08:14:34

像素与芯片

有态度网友ytd

3109文章数 19关注度

往期回顾全部

科技要闻

9000亿美元估值，Anthropic即将反超OpenAI

头条要闻

英国国王给特朗普送了口钟还贴脸开大"有需要尽管敲"

头条要闻

英国国王给特朗普送了口钟还贴脸开大"有需要尽管敲"

体育要闻

季后赛场均5.4分，他凭啥在骑士打首发？

娱乐要闻

孙杨博士学历有问题？官方含糊其辞

财经要闻

易会满被“双开”！

汽车要闻

专访捷途汪如生：捷途双线作战全球化全面落地

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

家居

数码

公开课

军事航空

教育要闻

水面对太阳辐射的反射率比普通地面强吗？

家居要闻

灵动实用生活艺术场

数码要闻

机械革命耀世18 Pro游戏本270HX Plus + 5070 12GB，10499元

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

意大利议会批准：捐赠航母给印度尼西亚

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版