网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

审计日砍令牌消耗62%，这块GPU每秒吐出3000令牌

2026-05-30 05:58:45　来源: 闪存猎手

北京举报

0

分享至

GitHub工程师们每天翻着审计日志，把那些冗余的模型调用一条条挑出来，再祭出MCP修剪——一套专门给提示词和模型互动瘦身的策略。InfoQ的报道披露，这套组合拳下去，代理工作流的令牌开销直接被压低了62%。

对把AI塞进CI/CD流水线的团队来说，这组动作正好打中了最肉疼的环节：代理模式下的大语言模型经常要反复呼叫，令牌消耗像水龙头忘了关，云账单不知不觉就飙上天。日度审计让高成本模式和无效调用无处遁形，MCP修剪则在不伤及代理能力的前提下，把不必要的令牌精准剔除，等于帮底层模型的每次交流做了次减脂手术。GitHub把这种操作总结成“MCP服务器模式”，给想用AI又怕烧钱的企业递了个现成的省钱样板。

同一时间，Hacker News上的一条博客展示的成绩，让标准GPU拥趸松了口气——在随处可得的普通图形处理器上跑大语言模型推理，单请求吞吐量冲到了每秒三千个令牌。过去这种实时响应水平总与昂贵的专有加速器捆绑，现在被拉到了白菜硬件上，意味着低延迟的对话AI、即时内容生成和动态代码补全这类应用，终于能甩掉天价基建的包袱。博客只披露了部分技术方向，提到模型架构的优化是推高速度的关键，但细节截断了，急得人抓耳挠腮。

此外，本期亮点还捎带了一个轻量消息：新冒出来的AI辅助迁移工具在入口解决方案之间搭了座桥，简化了云AI落地时常碰到的迁移麻烦。虽然没展开具体招式，但光凭“简化”二字，已经够让被不同网关配置折磨过的团队多看一眼。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

保洁在清华大学垃圾桶掏出2根金条，市场价值超20万元，校方已对接辖区派出所，物业：金条失主尚未寻到

重庆晨报 2026-06-03 07:14:34
5934 跟贴 5934
李亚飞任南京师范大学副校长

江苏新闻 2026-06-03 07:36:49
104 跟贴 104

鲜奶雪糕包装印“不加一滴水”配料表首位竟是水厂家：系旧包装，已改名“一滴水”

上游新闻 2026-05-29 18:03:05
1898 跟贴 1898

稻城亚丁景区弯道占比超八成，游客建议“接驳车合理收费”……记者实探→

环球网资讯 2026-06-02 21:36:26
650 跟贴 650
印度拟购114架“阵风”战机，军方称必要时准备“辛杜尔行动2.0”

澎湃新闻 2026-06-02 19:30:33
545 跟贴 545

日方公布辽宁舰动向这一次罕见没有发图

澎湃新闻 2026-06-02 21:50:13
84 跟贴 84

光明网评论员：电车该如何参与道路养护

澎湃新闻 2026-06-02 23:08:03
891 跟贴 891
阿里副总裁张凯夫离职创业，已开始招募人才

界面新闻 2026-06-03 12:43:36
12 跟贴 12

人民锐评：外卖骑手过剩？解决老问题当有新思维

澎湃新闻 2026-06-02 23:29:03
680 跟贴 680
成龙向全球发出入境游邀约：欢迎感受无滤镜的真实中国

新京报 2026-06-01 12:09:13
405 跟贴 405
车市观察｜上市8个月即推重大改款，乐道L90遭遇车主集中投诉

半岛官网 2026-06-03 09:22:09
74 跟贴 74
2026年全国高考报名人数为1290万人

央视新闻客户端 2026-06-03 14:02:58
103 跟贴 103
“我就是想停电了！” 江苏一售电公司发送停电通知被指“太任性”！

闪电新闻 2026-06-03 14:51:26
1 跟贴 1
创业板指涨逾4% 三市上涨个股近2000只

每日经济新闻 2026-06-03 13:10:07
0 跟贴 0
日经指数涨幅扩大，最新上涨2.5%

每日经济新闻 2026-06-03 10:19:11
451 跟贴 451
日菲启动所谓"划界谈判" 国台办驳斥

新京报 2026-06-03 10:45:11
1 跟贴 1
晋陕联动一张票可在壶口瀑布两侧景区跨区游览

大象新闻 2026-06-03 08:31:03
63 跟贴 63
挪威深海发现载有中国瓷器的18世纪沉船：大量青花瓷碗重见天日，文物达数千件，目前正开展船只溯源工作并努力还原历史真相

大风新闻 2026-06-02 12:15:18
0 跟贴 0
霍尔木兹大消息，美军宣布：“林肯”号航母参与封锁，战机空袭开往伊朗哈尔克岛油轮，致机舱起火！国际油价上涨，特朗普：尽快达成协议

每日经济新闻 2026-06-03 07:49:10
0 跟贴 0
抗癌博主获张雪邀请将出国观赛，当事人：不想被过度包装，给张雪带来不好影响

潇湘晨报 2026-06-03 16:33:17
0 跟贴 0
太气人！是亲生的吗？新生儿被父亲“丢”在上海儿童医院5个月！最新进展→

上海法治声音 2026-06-03 16:34:35
0 跟贴 0

「桃乃木香奈」引退作品释出引轰动！自称是出道十年来蕞好的作品

「桃乃木香奈」引退作品释出引轰动！自称是出道十年来蕞好的作品

孤独的独角兽影视

2026-06-03 09:50:10

罗马诺：老佛爷胜选后皇马会连续官宣

罗马诺：老佛爷胜选后皇马会连续官宣

懂球帝

2026-06-03 03:29:16

猛批华为“韬定律”是学术造假，杨学志到底什么来头？

猛批华为“韬定律”是学术造假，杨学志到底什么来头？

数字财经智库

2026-06-02 11:36:16

2026公交迎来大调整：不再站站停，上下车规则有新变化

2026公交迎来大调整：不再站站停，上下车规则有新变化

石辰搞笑日常

2026-06-03 00:47:31

油价大逆转！国内油价调整时间定了，6月4日历史罕见油价大幅下调

油价大逆转！国内油价调整时间定了，6月4日历史罕见油价大幅下调

有料财经

2026-06-02 19:38:40

皇马离队第3人敲定：29岁边缘人告别 7年15冠转会费600万

皇马离队第3人敲定：29岁边缘人告别 7年15冠转会费600万

叶青足球世界

2026-06-03 15:32:18

肠子悔青！《给阿嬷的情书》男主嫌剧组太简陋跑路，错失10亿票房，深夜痛哭再求合作

肠子悔青！《给阿嬷的情书》男主嫌剧组太简陋跑路，错失10亿票房，深夜痛哭再求合作

科学发掘

2026-06-03 07:05:34

600745，盘中直线“天地板”！此前7连涨停！

600745，盘中直线“天地板”！此前7连涨停！

证券时报e公司

2026-06-03 10:22:22

魏宗万女儿透露父亲去世细节：常年疾病积累，走时最放心不下老伴

魏宗万女儿透露父亲去世细节：常年疾病积累，走时最放心不下老伴

乡野小珥

2026-06-03 12:00:31

太讽刺啦，森林北素颜照曝光，可把汪峰彻底打醒咯

太讽刺啦，森林北素颜照曝光，可把汪峰彻底打醒咯

小邵说剧

2026-06-03 08:01:49

“司马懿”扮演者魏宗万离世，这些“鲜活的面容”近年来已悄然告别

“司马懿”扮演者魏宗万离世，这些“鲜活的面容”近年来已悄然告别

上游新闻

2026-06-03 16:09:20

国足官方：蒋光太、程进、拜合拉木将不随队前往新加坡，补招高天意

国足官方：蒋光太、程进、拜合拉木将不随队前往新加坡，补招高天意

懂球帝

2026-06-03 09:22:27

兜转半生落泪！王菲现身谢霆锋演唱会，才懂真爱无畏岁月

兜转半生落泪！王菲现身谢霆锋演唱会，才懂真爱无畏岁月

湘西二当家

2026-06-03 16:01:33

网红董赤赤栽了：1300万粉丝、54万债务，她的结局比想象中惨得多

网红董赤赤栽了：1300万粉丝、54万债务，她的结局比想象中惨得多

橙星文娱

2026-06-03 11:31:20

无法接受？新加坡联合早报：中国不是你的祖国，你们有自己的祖国

无法接受？新加坡联合早报：中国不是你的祖国，你们有自己的祖国

凡知

2026-06-03 06:30:41

和孔令辉分手13年，被黑人扛在肩上的马苏，终究走到了这一步

和孔令辉分手13年，被黑人扛在肩上的马苏，终究走到了这一步

暖心萌阿菇凉

2026-06-02 22:48:38

成人网红邦妮自曝恶心计划：6月办尿淋派对，粉丝可尿她发生关系

成人网红邦妮自曝恶心计划：6月办尿淋派对，粉丝可尿她发生关系

赴一场山海啊

2026-06-01 00:27:25

伊朗媒体发布穆杰塔巴照片：怀抱孩童，面带微笑

伊朗媒体发布穆杰塔巴照片：怀抱孩童，面带微笑

澎湃新闻

2026-06-02 23:04:02

“办案人员篡改伪造证人笔录，没被追责还升职了”，云南镇雄公安局原副局长刑满出狱后公开举报

“办案人员篡改伪造证人笔录，没被追责还升职了”，云南镇雄公安局原副局长刑满出狱后公开举报

大风新闻

2026-06-02 19:35:11

北京多个公园现“大号蒲公英” 专家：实为入侵物种

北京多个公园现“大号蒲公英” 专家：实为入侵物种

中国产学研合作促进会

2026-06-03 15:34:12

全网蹲好价的野生捕手，算力与羊毛都不可辜负。

4484文章数 37关注度

往期回顾全部

科技要闻

传DeepSeek融资意向500亿：腾讯投100亿

头条要闻

94版《三国演义》成观众心中"白月光" 多位扮演者离世

头条要闻

94版《三国演义》成观众心中"白月光" 多位扮演者离世

体育要闻

选择中国品牌的库里，和他们的巨大野心

娱乐要闻

官方痛批乱象刘涛郑恺等艺人遭点名

财经要闻

AI，开始偷懒了？

汽车要闻

依托全域辅助驾驶布局千里浩瀚助推吉利5月市场大热

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

游戏

艺术

健康

军事航空

教育要闻

盒子里的球怎么算组合？方法太简单！

《战舰世界》科幻联动最夯TOP3，错过任何一个都会失眠！

艺术要闻

二十年前割麦的场景

违规干细胞抗衰美容，为何肆无忌惮

军事要闻

美伊互袭波及多国过去一夜中东局势骤然升级

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版