网易首页 > 网易号 > 正文 申请入驻

国产模型跑在128G内存上,OpenAI没料到这波反击,用脚投票选了它

0
分享至

2026年刚开始,一个叫OpenClaw的开源项目就火了起来,它在GitHub上星星数涨到了20万,海外的开发者都抢着下载里面的Agent技能包,一天就有几千次下载,国内有个叫“水产市场”的平台也跟着热闹起来,三天内被下载了3300次,不过这个平台其实只是个工具货架,把GitHub上的东西打包放上去,用户点一下就能用,不用自己重新写代码。



就在大家关注OpenClaw的时候,一个没怎么宣传的模型悄悄爬上全球调用榜第三位,它叫Step 3.5 Flash,由阶跃星辰推出,从2月26日开始,它单日排名只落后于GPT-4o和Claude 3.5,关键的是,这个模型既没有进入OpenClaw首页推荐,也没有找其他机构合作推广,全靠开发者自己去试用、使用并转发。



这件事有点反常,一般新模型发布后,团队都会大力推广,发新闻稿、做直播、找大V合作,但阶跃没有这么做,有人去Reddit的r/LocalLLaMA社区提问,他们直接派了11个人,包括CEO、CTO和首席科学家,当场开了一个问答会,有人问到工具调用总崩溃的问题,还有人揪着无限循环漏洞不放,他们没有回避,CTO朱亦博当场承认,早期只测试了数学和编程部分,工具链确实没顾得上,是经验不够造成的。



最让人意外的是他们的参数设计,现在主流大模型动不动就超过230B,4-bit量化后显存轻松突破128GB,普通机器根本承受不住,要么降低到3-bit牺牲精度,要么依赖硬盘交换数据,速度慢得就像卡碟,阶跃偏偏不这么做,他们把模型控制在196B左右,采用MoE结构,刚好处在“4-bit加上256K上下文等于128GB内存”的临界点,他们这样做的原因在于,CTO自己买了一台128GB的Mac Pro,首席科学家配备了128GB的AMD工作站,每天都在上面运行模型,就是为了验证一个事实:本地能够运行,才是真正可用的。

海外用户留言说,这是唯一能在笔记本上跑满256K上下文的模型,这不是吹的,是真的能用,以前的模型再强,你下载回来发现显存不够,只能删掉重来,现在这个模型插上就能跑,连调试时间都省了一小时。



AI的发展带来了变化,过去聊天机器人每秒处理20-30个token就够用,用户看到文字逐字出现,多等一会儿也没关系,现在的需求转向Agent模式,用户把任务直接交给它,比如问“文件处理好了吗”,如果响应慢了就会被放弃,速度不再是加分项,而是关键因素,阶跃公司也明确区分:L1负责对话,L2进行推理,L3执行任务,这三个阶段不能混淆,用对话模型硬撑Agent的工作,只会浪费计算资源在无效操作上。

他们承认自己存在缺陷,比如知识遗忘问题,公开解释是因为对齐训练中加了太多约束,模型被限制在一个小知识圈里出不来,还贴出了修复计划,准备用强化学习训练来控制推理长度减少死循环,更有趣的是,有开发者看完直接留言说帮他们写llama.cpp的自动解析器来解决工具调用卡顿的问题,这种事情以前很少发生。

这其实反映了思路的不同,美国公司习惯堆算力,觉得越大越好,而阶跃的做法正相反,在算力有限的情况下,优先考虑能不能在主流开发设备上运行,这让人想起华为做芯片的思路,不盲目追求制程,而是先保证能用、能存活下来,真正的门槛可能不在数据或算力,而是你愿不愿意为了用户,自己先掏钱买一台128G内存的电脑试试。

有人问这个模型是不是特别神奇,其实它没有那么神秘,就是设计得比较实在,参数数量刚刚好,部署起来不算复杂也不简单,遇到问题会及时处理不拖延,开发者做这个模型的初衷,从来都不是追求最强大的性能,而是希望它能真正派上用场。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
过去30年,中国三次忍辱负重“装孙子”躲过美国阻击,终迎大发展

过去30年,中国三次忍辱负重“装孙子”躲过美国阻击,终迎大发展

阿胡
2024-06-13 14:25:16
中伊外长紧急通话,王毅一番话稳住伊朗,特朗普的访华行程悬了?

中伊外长紧急通话,王毅一番话稳住伊朗,特朗普的访华行程悬了?

奇思妙想生活家
2026-03-03 01:30:40
铁饭碗不铁了!中国公务员7年来首次缩招,还有一个坏消息

铁饭碗不铁了!中国公务员7年来首次缩招,还有一个坏消息

户外阿毽
2026-03-02 19:11:27
你看过哪本小说让你觉得作者不一般?网友:我是跪着看完的!

你看过哪本小说让你觉得作者不一般?网友:我是跪着看完的!

另子维爱读史
2026-01-02 21:47:03
几块钱的维生素B2,竟是高血压克星?提醒:还有助改善性生活

几块钱的维生素B2,竟是高血压克星?提醒:还有助改善性生活

橘子约定
2026-02-27 09:33:19
全红婵去河南了,不是训练,不是比赛,而是直接飞去河南找刘清漪

全红婵去河南了,不是训练,不是比赛,而是直接飞去河南找刘清漪

东方不败然多多
2026-02-28 20:13:47
560名美军伤亡,林肯号挨炸,美国爆发游行,特朗普算错一件事!

560名美军伤亡,林肯号挨炸,美国爆发游行,特朗普算错一件事!

钦点历史
2026-03-02 13:53:29
以为是假新闻其实是真新闻,从袁立到王星,件件离谱又惊人

以为是假新闻其实是真新闻,从袁立到王星,件件离谱又惊人

上官晚安
2026-01-06 08:08:35
大量日系“电视棒”流入闲鱼,跟打火机一样小,预装安卓系统

大量日系“电视棒”流入闲鱼,跟打火机一样小,预装安卓系统

科技拌饭
2025-09-08 19:21:46
荷兰半导体专家:ASML花费40年钻研光刻机,中国企业竟比ASML还狠

荷兰半导体专家:ASML花费40年钻研光刻机,中国企业竟比ASML还狠

策略述
2026-02-28 17:11:40
鞠萍姐姐正式官宣退休,42年的央视生涯,退休金曝光却引发争吵

鞠萍姐姐正式官宣退休,42年的央视生涯,退休金曝光却引发争吵

错过美好
2026-03-02 10:12:05
惊悚!爱泼斯坦案再爆猛料,小李子被指曾吃过70磅 “儿童肉”?

惊悚!爱泼斯坦案再爆猛料,小李子被指曾吃过70磅 “儿童肉”?

今朝牛马
2026-03-02 22:28:10
第十波打击!特朗普做梦都不敢想,伊朗会越打越猛,以色列被打疼

第十波打击!特朗普做梦都不敢想,伊朗会越打越猛,以色列被打疼

Ck的蜜糖
2026-03-03 01:41:24
正月十五元宵节,不管有钱没钱,记得吃3种“吉食”,接财又接福

正月十五元宵节,不管有钱没钱,记得吃3种“吉食”,接财又接福

简食记工作号
2026-03-03 00:13:25
特朗普打伊朗有没有通知中国?中国外交部给出干脆回答

特朗普打伊朗有没有通知中国?中国外交部给出干脆回答

爱下厨的阿酾
2026-03-03 01:31:41
资本狂欢下中美AI竞争的隐忧

资本狂欢下中美AI竞争的隐忧

烽火瞭望者
2026-03-02 06:43:24
朱婷加比相撞,紧急送医治疗,检查结果出炉

朱婷加比相撞,紧急送医治疗,检查结果出炉

跑者排球视角
2026-03-02 23:29:37
伊朗不是委瑞内拉,哈梅内伊不是马杜罗,军事专家逐渐失去信任!

伊朗不是委瑞内拉,哈梅内伊不是马杜罗,军事专家逐渐失去信任!

眼光很亮
2026-03-01 16:43:04
炒作台湾话题实为留住琉球美军?为什么说琉球独立越来越近了?

炒作台湾话题实为留住琉球美军?为什么说琉球独立越来越近了?

通文知史
2026-03-01 23:00:03
直到看见蒋万安给儿子们起的名字,就知道他骨子里的身份瞒不住

直到看见蒋万安给儿子们起的名字,就知道他骨子里的身份瞒不住

小熊侃史
2026-02-23 13:00:17
2026-03-03 03:44:49
冒泡泡的鱼儿
冒泡泡的鱼儿
每天带来社会资讯
626文章数 15406关注度
往期回顾 全部

科技要闻

苹果中国官网上线iPhone 17e,4499元起

头条要闻

特朗普:对伊朗打击或持续4至5周 已击沉其10艘舰艇

头条要闻

特朗普:对伊朗打击或持续4至5周 已击沉其10艘舰艇

体育要闻

“想要我签名吗” 梅西逆转后嘲讽对手主帅

娱乐要闻

李亚鹏与哥哥和解 只有一条真心话短信

财经要闻

油价飙升 美伊冲突将如何搅动全球经济

汽车要闻

国民SUV再添一员 瑞虎7L静态体验

态度原创

健康
艺术
教育
手机
本地

转头就晕的耳石症,能开车上班吗?

艺术要闻

这四位老人的花鸟画,竟让人欲罢不能!

教育要闻

3月13日截止!山东综评云平台填写教程!有视频!

手机要闻

iPhone 17e外观与前代几乎一致 旧款iPhone 16e保护壳可继续用

本地新闻

津南好·四时总相宜

无障碍浏览 进入关怀版