网易首页 > 网易号 > 正文 申请入驻

MLH用12个月赌一把:17000个模型的记忆难题,终于被捅破了

0
分享至


去年全球黑客马拉松产出了超过12万个AI原型,其中73%在演示结束后的一周内被遗弃。不是因为想法不够好,而是因为它们患上了同一种病——金鱼记忆。

用户刚说完"帮我订周三的机票",三句话后就变成"什么时候的机票来着"。这种挫败感,MLH(Major League Hacking,全球最大的学生黑客马拉松组织)看了整整十年。

他们算过一笔账:一个48小时的黑客马拉松,平均有31个小时花在" plumbing"——会话逻辑、向量数据库、状态管理这些基础设施上。真正用来做产品的时间,被压缩到不足17个小时。

80%的工程税:学生开发者不该付的账单

MLH团队的原话很直接:「We are tired of seeing great projects die because the 'plumbing' swallows 80% of the weekend.」

这不是夸张。他们见过太多这样的场景:一个团队周五晚上想出了惊艳的创意,周六下午还在调Prompt(提示词)的上下文窗口,周日凌晨发现换个大模型就得重写整个记忆层。最后Demo时,评委问"如果用户中途退出再回来呢",全场沉默。

问题的根源在于"无状态"(Stateless)设计。当前主流的大语言模型(LLM,Large Language Model)每次调用都是独立的,它不记住你是谁、你们聊过什么。开发者被迫在应用层手动拼接历史记录,像用胶带粘碎玻璃——能粘,但一碰就散。

更隐蔽的成本是模型切换。你想从GPT-4o换到Claude,或者试试开源的Llama?可以,但你的记忆层代码可能全废。每个模型有自己的上下文格式、Token(文本处理单元)限制、系统提示风格。MLH的观察是:「You should not have to rebuild your entire logic layer just because you want to switch from GPT-4o to Claude.」

但现实是,大多数人确实在重建。一遍又一遍。

Backboard.io入局:一个API接管17000个模型的记忆

4月10日,MLH在Global Hack Week上扔出了一张牌:与Backboard.io达成12个月深度合作。

Backboard.io是什么?按官方定位,它是一个"有状态API"(Stateful API)——你的应用不需要再自己管记忆,调用Backboard.io,它帮你记住用户的一切:对话历史、偏好设置、未完成的工作流、甚至跨会话的上下文关联。

几个关键数字:支持17000+模型,内置模型路由,允许自带API Key(应用编程接口密钥)。这意味着什么?你可以今天用GPT-4o,明天切到Claude,后天试试Gemini,用户的记忆不会丢,你的代码不用改。

技术层面,Backboard.io处理的是RAG(检索增强生成,Retrieval-Augmented Generation)工作流和工具调用(Tool Calling)。说人话:它不仅存记忆,还能在需要时智能检索、调用外部工具,然后把结果无缝塞进对话流。

MLH选择它有个直接原因——排名。Backboard.io在LoCoMo和LongMemEval这两个AI记忆基准测试里都是第一。这不是营销话术,是实打实的评测数据。

免费终身使用权:MLH想赌什么

合作的条款很激进:今年所有MLH活动的参与者,获得"终身免费的状态管理" + 开发积分。

覆盖范围是50场活动,从4月的Global Hack Week开始。MLH专门设了一个奖项类别:"Best Use of Backboard.io"(最佳Backboard.io应用)。

他们的期待写得很清楚:「We want to see what happens when you stop worrying about how your app will remember a user and start focusing on what the app actually does.」

翻译一下:别再把周末耗在 plumbing 上了,去搞点真正的东西。

这个赌局的底层逻辑是——当记忆基础设施被抽离成公共服务,AI应用的创新速度会跳一档。就像当年AWS(亚马逊云服务)把服务器成本打到地板价,催生了一波SaaS(软件即服务)创业潮。MLH赌的是,状态管理会成为下一个被"云化"的层。

但风险也在这里。Backboard.io本身是个创业公司,12个月的合作期后能否续上?17000个模型的支持是技术亮点,也是维护负担。如果某个小众模型更新后兼容性出问题,谁来兜底?

MLH的回应是先把事做成。他们的社区经理在公告下留言:「We thought the friendship was a no brainer 」——这句话被顶到了评论区第一。

评论区里的行业共鸣

公告发出去后,一条评论被反复引用:「Engineering tax is the perfect phrase for this.」

说这话的人不是MLH的人,是个独立开发者。他的完整评论是:「Every team building AI agents solves memory and state management from scratch. The first 80% feels productive. The last 20%...」话没说完,但大家都懂。

那20%是边缘情况处理:用户突然切换话题怎么办、长对话如何压缩历史、敏感信息怎么遗忘、多设备同步怎么保证一致性。每个问题都能吃掉一个周末,而且没有标准答案。

另一条评论来自MongoDB的人:「Quite an interesting API integration to MLH! Can't wait to see how it goes!」——带着赞助商式的热情,但也透露出一个信号:数据库厂商也在盯这个赛道。毕竟,记忆最终要落盘,落盘就绕不开存储架构。

还有人@了Backboard.io的CEO Jonathan:「You guys certainly made a great choice indeed! Congrats Jonathan :D」

这些反馈勾勒出一个微妙的位置:Backboard.io不是唯一的玩家,但它是第一个大规模进入学生开发者生态的。MLH的50场活动、数万名参与者,相当于给它铺了一个巨大的测试场。

技术细节:有状态API到底改了什么

值得拆解一下Backboard.io的工作方式,因为"有状态"这个词被用得太滥了。

传统的无状态调用是这样的:你的应用把用户的问题+历史记录打包成Prompt,发给OpenAI或Anthropic,拿到回复,自己存进数据库。下次用户再来,你再打包、再发、再存。你是记忆的搬运工,LLM只是推理引擎。

Backboard.io的模式是:你的应用只发当前问题,Backboard.io自动关联用户ID、调取历史、管理上下文窗口、处理模型切换。它甚至能根据问题类型自动路由到最合适的模型——简单查询走轻量级模型,复杂推理换大模型,全程对开发者透明。

这个抽象层的代价是延迟增加(多一跳网络请求)和供应商锁定风险。收益是开发速度。对于48小时的黑客马拉松,后者显然更重要。

一个被低估的功能是"自带API Key"。Backboard.io不强制你用它的模型配额,你可以绑自己的OpenAI Key、Anthropic Key,甚至本地部署的开源模型。它收的是状态管理费,不是模型调用费。这个定价策略很聪明——不和大厂正面竞争,切的是它们没做好的环节。

从黑客马拉松到生产环境:这条鸿沟还在

MLH的公告里有个词用得很谨慎:「scale a prototype into a production-ready agent without a complete rewrite」。注意是"production-ready"(生产就绪),不是"production-proven"(生产验证)。

黑客马拉松的Demo和生产环境的负载,中间隔着几个数量级。一个Demo可以假装用户不会同时开十个会话,生产环境不行。Demo可以容忍偶尔的记忆丢失,金融、医疗场景不行。

Backboard.io的LoCoMo第一、LongMemEval第一,测的是记忆检索的准确性,不是并发性能、不是合规审计、不是多区域容灾。这些才是企业级采购的硬门槛。

但MLH的算盘可能不在这里。他们的核心受众是学生和早期创业者,这些人需要快速验证想法,而不是扛住双十一流量。先把"无状态AI"的工程税免掉,让更多人能走到Demo Day,本身就是价值。

至于那些真的做大了的,自然会面对新的选择:继续用Backboard.io,还是自建记忆层?这是个好问题,意味着至少有人做大了。

行业视角:记忆层正在从隐形走向显性

2023年,AI应用的关注点全在模型能力——谁更大、谁更快、谁更便宜。2024年,焦点开始偏移。LangChain、LlamaIndex这些框架的流行,说明开发者意识到:模型只是食材,记忆和工具调用才是菜谱。

Backboard.io代表的是一个更激进的趋势——把记忆层完全外包,像用Stripe(支付服务)处理交易、用SendGrid(邮件服务)发邮件一样。这个趋势的名字还没定,有人叫"Memory-as-a-Service",有人叫"Stateful AI Infrastructure"。

竞争格局也在变。OpenAI最近更新了Assistants API,内置了线程管理和文件检索。Claude有Computer Use,但记忆还是应用层的事。Anthropic的MCP(模型上下文协议)试图标准化工具调用,但记忆格式还是各玩各的。

Backboard.io的差异化在于中立性——不绑任何一家模型厂商,17000个模型的支持就是宣言。这在理论上让你能随时切换供应商,避免被OpenAI或Anthropic锁死。实践中能不能做到,要看它的抽象层有多薄、多稳定。

另一个变量是边缘计算。如果记忆要实时检索,数据放哪里?Backboard.io的架构细节没公开,但MLH的公告里提到了"securely"(安全地)。对于欧盟的GDPR(通用数据保护条例)、美国的州级隐私法,合规不是小事。

那剩下的20%呢

回到评论区那条没说完的话:「The first 80% feels productive. The last 20%...」

MLH和Backboard.io的合作,解决的是那80%里的很大一部分—— plumbing 的标准化。但最后的20%,那些真正定义产品体验的 edge cases(边缘情况),可能永远无法被完全外包。

比如:一个心理健康AI,用户上周提到"最近睡不好",这周说"我辞职了",系统该怎么关联这两句话?权重怎么设?要不要主动追问?这些不是技术问题,是产品设计问题,甚至伦理问题。

Backboard.io能提供基础设施,但决策权还在开发者手里。MLH的"Best Use of Backboard.io"奖项,评的应该也是这种判断力——不是谁调用了API,而是谁用记忆做出了真正的差异化。

一个可能的场景:今年某场黑客马拉松上,有个团队用Backboard.io做了一个跨会话的创意写作助手。用户周一写了一半的小说,周五回来,AI不仅记得情节,还主动提了三个续写方向,基于用户过去喜欢的风格。这种体验,在无状态时代几乎不可能实现。

如果这样的案例出现,MLH的12个月赌局就算赢了第一步。

MLH的公告结尾是一句短促的呼吁:「Don't build another forgetful app. It is a waste of your time.」

但问题是——当记忆变得唾手可得,开发者会不会反而懒于思考,什么样的记忆该被保留、什么样的该被遗忘?一个永远记得你所有偏好的AI,是贴心还是窒息?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
安徽六岁女童嫌疑犯的社交账号,让人越看心里越发毛,家有两娃

安徽六岁女童嫌疑犯的社交账号,让人越看心里越发毛,家有两娃

魔都姐姐杂谈
2026-04-08 05:08:34
市场情绪提振!美股全线走强,特朗普:对美伊达成和平协议“非常乐观”,“如果他们不达成协议,后果将极其痛苦”

市场情绪提振!美股全线走强,特朗普:对美伊达成和平协议“非常乐观”,“如果他们不达成协议,后果将极其痛苦”

每日经济新闻
2026-04-10 11:16:26
碎三观!杭州一院长关灯猥亵女经理被举报,妻子称是“国外习惯”

碎三观!杭州一院长关灯猥亵女经理被举报,妻子称是“国外习惯”

火山詩话
2026-04-10 11:45:42
美国AI三巨头联手限制蒸馏:最便宜的那条路,被掐断了

美国AI三巨头联手限制蒸馏:最便宜的那条路,被掐断了

卢松松
2026-04-08 14:07:41
向来福气深厚,下半年更是好运爆棚的4个生肖,升官发财平安!

向来福气深厚,下半年更是好运爆棚的4个生肖,升官发财平安!

毅谈生肖
2026-04-10 12:33:39
陈丽华追悼会曝光,原来无儿无女的迟重瑞,早已被安排好“退路”

陈丽华追悼会曝光,原来无儿无女的迟重瑞,早已被安排好“退路”

青梅侃史啊
2026-04-09 19:57:58
以色列警告:伊朗新领导层更极端,更敢赌——报复不再留手

以色列警告:伊朗新领导层更极端,更敢赌——报复不再留手

桂系007
2026-04-10 14:07:39
68岁女子不顾家人反对,执意寻找50年前初恋,发现对方为她终身未娶,初恋:我等你等得头发都白了!

68岁女子不顾家人反对,执意寻找50年前初恋,发现对方为她终身未娶,初恋:我等你等得头发都白了!

励职派
2026-04-03 12:45:44
没想到,陈丽华去世后,竟给无儿无女的迟重瑞留下了一个“礼物”

没想到,陈丽华去世后,竟给无儿无女的迟重瑞留下了一个“礼物”

小娱乐悠悠
2026-04-10 09:32:47
戴森憋了30年憋出99美元小风扇,风速55mph却不敢吹脸

戴森憋了30年憋出99美元小风扇,风速55mph却不敢吹脸

全栈遛狗员
2026-04-09 18:04:56
复旦大学研究:我国财政供养人员6846万,其中退休人员占四成!

复旦大学研究:我国财政供养人员6846万,其中退休人员占四成!

黯泉
2026-04-09 17:27:59
全球同时收到消息,北京迎来贵宾,见面握紧中方手,美国时代结束

全球同时收到消息,北京迎来贵宾,见面握紧中方手,美国时代结束

傲傲讲历史
2026-04-10 02:32:06
“觞觥觚斛”这四个字怎么读?能读出来说明文化程度相当不低!

“觞觥觚斛”这四个字怎么读?能读出来说明文化程度相当不低!

未央看点
2026-04-10 00:08:51
美股深V反弹,半导体股爆发,闪迪涨超9%,中概股走低,现货黄金失守4760美元

美股深V反弹,半导体股爆发,闪迪涨超9%,中概股走低,现货黄金失守4760美元

21世纪经济报道
2026-04-10 07:09:55
初中三年,我最后悔的事:让他一个人关在房间里写作业

初中三年,我最后悔的事:让他一个人关在房间里写作业

诺妈家有男宝娃
2026-04-10 12:08:53
黑龙江这件事,窒息感扑面而来!

黑龙江这件事,窒息感扑面而来!

胖胖说他不胖
2026-04-10 09:55:12
没想到!第一个为全红婵站出来的竟然是66岁的韩乔生,太解气了!

没想到!第一个为全红婵站出来的竟然是66岁的韩乔生,太解气了!

喜欢历史的阿繁
2026-04-10 07:30:52
“解冻是真实的”!中方证实:5年多来首次访华

“解冻是真实的”!中方证实:5年多来首次访华

第一财经资讯
2026-04-09 14:49:20
雷迪克:詹姆斯展现了强大的领导力,为整支球队奠定了基调

雷迪克:詹姆斯展现了强大的领导力,为整支球队奠定了基调

懂球帝
2026-04-10 13:23:06
都是穷,河南的穷,四川的穷,有什么差别

都是穷,河南的穷,四川的穷,有什么差别

高广银
2026-04-10 06:09:37
2026-04-10 15:04:49
薛定谔的BUG
薛定谔的BUG
有态度网友ytd
1119文章数 30关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

夏克立婚内出轨 曾参加《爸爸去哪儿》

财经要闻

爱尔眼科一院长被指猥亵 总部:已被停职

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

亲子
健康
艺术
旅游
教育

亲子要闻

手外纪事|第57期 束带宝宝,父母没有放弃治疗,换来孩子一个未来

干细胞抗衰4大误区,90%的人都中招

艺术要闻

于小冬2026年4月油画新作《花季》

旅游要闻

亚洲游客抛弃中东,扎堆邮轮与短途游

教育要闻

二年级培优,难倒99%的学生

无障碍浏览 进入关怀版