网易首页 > 网易号 > 正文 申请入驻

5毫秒路由干翻600倍慢的大模型,这个反直觉决策让成本归零

0
分享至


一个桌面AI销售教练,要在10个"创始人声音"里选一个回答用户问题。路由延迟从3000毫秒砍到5毫秒,成本从每次0.005美元变成零,准确率只掉了4个百分点。作者选了后者。

这不是性能优化的故事,是关于什么时候该对"智能"说不的算术题。

产品长什么样

这套叫Sales Agent Pack的系统,本质是Electron桌面应用+Claude Code技能包。核心机制:用户输入销售问题,系统从10个"理事会声音"里挑一个作答。

每个声音不是角色扮演prompt,而是3000字的Markdown文件——从SaaS创始人的公开写作里提取的真实语料,聊天时整份塞进系统提示词。选错声音,答案技术正确但调性全错。

路由决策的典型案例:

"该不该把价格提到79美元?"→该找Lemkin(SaaStr运营者,做过大量定价实验)

"输给HubSpot了,角度在哪?"→该找Levie(挑战者定位专家)

"BP感觉太通用"→该找Chesky(身份驱动销售、设计背景)

路由质量直接决定用户体验。作者试了两种方案。

方案A:大模型元路由

思路很直觉:让Claude自己选。每次请求前先问一遍"这问题该谁答",代码长这样:

async function pickVoiceLLM(message) { const response = await anthropic.messages.create({ content: `Question: "${message}"\n\nWhich voice should answer? Reply with just one word from: Collison, Benioff, Lutke, Chesky, Huang, Altman, Amodei, Levie, Butterfield, Lemkin.` }); return response.content[0].text.trim(); }

100条样本测试下来:单次调用成本约0.005美元(输出50 token,输入约120 token),准确率89%——对比作者手工标注的"正确答案"。

延迟没提,但Anthropic API的冷启动+往返,实际体感在2-3秒级。对桌面应用来说,用户敲完问题要等一个"选谁回答"的额外往返,体验割裂。

方案B:确定性关键词路由

代码土得掉渣:一堆if判断,加个买家原型启发式。

function pickVoice(message, conversationType) { const m = message.toLowerCase(); // 硬覆盖——显式对话类型优先 if (conversationType === 'post_mortem') { return { primary: 'Lemkin', voiceFile: 'council/10-lemkin.md' }; } if (conversationType === 'competitive_positioning') { return { primary: 'Levie', voiceFile: 'council/08-levie.md' }; } // 定价关键词→Lemkin(SaaStr运营者) if (/price|pricing|raise.*price|tier|discount|annual.*contract/.test(m)) { return { primary: 'Lemkin', voiceFile: 'council/10-lemkin.md' }; } // ...更多规则 }

实测结果:延迟5毫秒,成本为零,准确率85%。

600倍速度差,4%准确率差距,无限成本差。作者选了方案B。

为什么"不够智能"反而赢了

这个决策违背了近两年AI产品的一个惯性:能用大模型就不用规则,能端到端就不分层。作者的算术拆得很细:

第一,错误成本不对称。路由错了,用户得到的是"风格不搭的正确答案",不是灾难性失败。85%和89%的差距,在实际体验里被后续对话的上下文修复能力稀释。

第二,延迟是产品级缺陷。桌面AI工具的竞争力在"跟得上思路",3秒路由延迟打断心流,5毫秒无感知。用户不会为4%的准确率提升忍受每次提问的卡顿。

第三,成本结构决定商业模式。0.005美元看起来便宜,但按日均1000次路由算,月成本150美元——对独立开发者的小工具,这是净利润和亏损的边界。零成本意味着可以定价更低或免费增值。

第四,可维护性被低估。关键词路由的失效模式透明:哪个词匹配错了,肉眼能调试。大模型路由的失效是黑箱,"为什么这次选了Altman而不是Amodei",需要逐条看log猜意图。

什么情况下该反着来

作者没说的边界同样重要。关键词路由能work,前提是问题类型和创始人专长有显式映射关系——定价、竞争、复盘、设计,这些词天然带领域标签。

如果10个声音的区别是"激进vs保守"或"数据驱动vs直觉驱动"这种维度,关键词会失效。这时候大模型对语义的模糊匹配能力才不可替代。

另一个变量是规模。10个选项是人工写规则的上限,100个选项时关键词组合的爆炸会让维护变成噩梦。但在产品早期,"刚好够用"的复杂度往往是护城河。

Claude Code的兴起让"用大模型路由大模型"变得极低成本——几行代码就能搭原型。这种易得性反而制造陷阱:默认选最"智能"的方案,而不做算术。

作者的实践是个提醒:智能是资源,不是美德。当确定性规则能覆盖80%场景时,剩下的20%也许不值得用20倍的成本去追。

产品昨晚已发:clskills.in/sales-agent-saas。10个创始人声音里,Lemkin的定价规则和Levie的竞争话术被命中频率最高——这是关键词路由留下的可观测副产品,比准确率数字更能说明用户真正在问什么。

如果你在做多Agent系统,路由层的设计决策,是选5毫秒还是3000毫秒,算过账了吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
又丢脸了,时隔四年,乌克兰再次命中俄罗斯黑海舰队旗舰

又丢脸了,时隔四年,乌克兰再次命中俄罗斯黑海舰队旗舰

林子说事
2026-04-12 11:48:54
姚敏学同志逝世

姚敏学同志逝世

新京报政事儿
2026-04-13 09:24:06
詹姆斯今夏或大幅降薪!美媒直言:离开湖人首选勇士联手库里冲冠

詹姆斯今夏或大幅降薪!美媒直言:离开湖人首选勇士联手库里冲冠

钱说体育
2026-04-13 09:49:16
3月销冠还是Model Y:网上没赢过,现实没输过

3月销冠还是Model Y:网上没赢过,现实没输过

小南看车
2026-04-11 07:04:23
遁入空门?百万遗产不要了?迟重瑞寺庙诵经,白岩松一语道破真相

遁入空门?百万遗产不要了?迟重瑞寺庙诵经,白岩松一语道破真相

嘴角上翘的弧度
2026-04-12 19:08:55
这一晚,中国男篮的体面,终于被改年龄撕了个粉碎

这一晚,中国男篮的体面,终于被改年龄撕了个粉碎

五姑娘台球
2026-04-12 22:32:24
周涛结束了和丈夫的12年婚姻,她说:这段婚姻太痛苦了,身心俱疲

周涛结束了和丈夫的12年婚姻,她说:这段婚姻太痛苦了,身心俱疲

阿讯说天下
2026-04-12 17:53:46
牧夫座空洞直径2.5亿光年,却几乎什么都没有,是谁摧毁了这里?

牧夫座空洞直径2.5亿光年,却几乎什么都没有,是谁摧毁了这里?

观察宇宙
2026-04-11 21:26:55
哈立德抵达北京开始访华

哈立德抵达北京开始访华

澎湃新闻
2026-04-12 21:54:18
具俊晔去玫瑰园看望大S被偶遇,瘦得不成样子,背影像干巴老头

具俊晔去玫瑰园看望大S被偶遇,瘦得不成样子,背影像干巴老头

TVB的四小花
2026-04-13 04:28:29
《教父》:人在失去什么后,会变得沉默且孤独?

《教父》:人在失去什么后,会变得沉默且孤独?

洞见
2026-04-12 15:21:40
从质疑到理解,原来73岁无儿无女的迟重瑞,早被陈丽华安排好退路

从质疑到理解,原来73岁无儿无女的迟重瑞,早被陈丽华安排好退路

皮皮电影
2026-04-13 09:58:59
知名男星凌晨5点多在西湖跳舞!背景美成水墨画:不愧是江南

知名男星凌晨5点多在西湖跳舞!背景美成水墨画:不愧是江南

极目新闻
2026-04-12 21:12:34
不打了!大规模轮休!俯冲西部第4挑选火箭

不打了!大规模轮休!俯冲西部第4挑选火箭

篮球实战宝典
2026-04-12 19:29:05
80万点赞的“火柴大神”被扒皮:零成本造假,偷走了手艺人的所有荣光

80万点赞的“火柴大神”被扒皮:零成本造假,偷走了手艺人的所有荣光

最黑科技
2026-04-11 21:21:16
反智的航天学院副院长

反智的航天学院副院长

律法刑道
2026-04-13 08:32:38
“张雪的机车”,账号被封禁!

“张雪的机车”,账号被封禁!

营销报
2026-04-07 13:54:34
别盯李小冉的脸了,她的背才是真正的人间清醒

别盯李小冉的脸了,她的背才是真正的人间清醒

陈意小可爱
2026-04-11 15:35:20
无滤镜后,萧蔷像隔壁大婶,李小冉断崖式衰老,瞿颖孙怡村里村气

无滤镜后,萧蔷像隔壁大婶,李小冉断崖式衰老,瞿颖孙怡村里村气

白面书誏
2026-04-12 17:06:22
这绝对是史上最不礼貌的键盘

这绝对是史上最不礼貌的键盘

放毒
2026-04-11 10:53:19
2026-04-13 10:31:00
固件更新中
固件更新中
有态度网友ytd
1685文章数 16关注度
往期回顾 全部

科技要闻

李想向黑水军开炮!连发5条朋友圈

头条要闻

伊朗公布美方三大"无理要求":要均分霍尔木兹海峡收益

头条要闻

伊朗公布美方三大"无理要求":要均分霍尔木兹海峡收益

体育要闻

创造历史!五大联赛首位女性主教练诞生

娱乐要闻

赌王女儿何超蕸病逝,常年和乳癌斗争

财经要闻

封锁,还是收费站?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

房产
数码
手机
公开课
军事航空

房产要闻

土地供应突然暴跌!2026海口楼市,格局大变!

数码要闻

联芸将开发PCIe Gen6消费级SSD主控MAP2001,瞄准28GB/s

手机要闻

华为Pura 90 Pro Max喜提麒麟9030 Pro:华为史上最强芯片 4月20日亮相

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国副总统万斯:美伊谈判未能达成协议

无障碍浏览 进入关怀版