网易首页 > 网易号 > 正文 申请入驻

Hermes4.336B开源:24台电脑分布式训练超越70B

0
分享至

4月30日,Nous Research 把一个“训练范式”的闸门直接掀开,Hermes 4.3 36B 正式开源。它不是那种靠玄学堆规模的开源,反而用 24 台普通电脑节点,拼出一个分布式训练网络,然后跑出更聪明的结果。参数少一半,性能还反超自家 70B,训练效率还摸到 144k tokens秒,关键是 Apache 2.0 全线开源,商用零限制。更狠的是,他们故意让同一套能力走两遍路,一遍集中式,一遍 Psyche 去中心化网络,结果分布式赢了,像是在宣告,未来模型生产的“工厂模式”会变。


当下异动之后,得把历史翻回去。开源模型过去几年最常见的叙事是两条路,规模上去,算力铺满,或者数据合规后再谈“可用”。但这次 Hermes 4.3 36B 的关键不在“能跑”,在“怎么生产”。它走的是 Psyche 分布式训练网络,24 个节点分布全球,用 Solana 区块链做共识协调,用 DisTrO 优化器把梯度在公网上传。P2P 通信开销不单独摊账,而是被隐藏进训练时间里,最后你看到的是 144k tokens秒的训练速度,效率跟集中式没差,甚至略优。换句话说,系统层面先把“把网络当工厂”这件事做成了,再把模型能力交付给开发者。

时间跳一下,你会发现这类路线其实不是凭空冒出来。早期在分布式学习里,真正难的从来不是训练本身,而是协同的治理成本。集中式方案把治理外包给一台大集群,调度、同步、梯度聚合都能在同一套系统里完成。去中心化方案则反过来,先要解决“谁可信、谁对齐、谁不拖后腿”,再谈训练吞吐。Solana 这种把共识协调拆成链上可验证机制的思路,在这里扮演的是“协同规则的底座”。它的价值不在“更快”,在“让分布式训练能持续运行”。你看他们敢用公网上传梯度,敢说通信开销被隐藏进训练时间,这意味着网络抖动、带宽波动、节点异步等问题,至少在工程上被压住了。



再往产业里看,Hermes 4.3 36B 的第二个炸点更直接。对比 Hermes 4(70B)与 Hermes 4.3(36B),参数从 70B 到 36B,直接少一半。训练方式从传统集中式,变成分布式 + Solana 区块链,再叠加 DisTrO 优化器的梯度传输机制。训练效率的基准位置反而没被打下去,144k tokens秒的数字说明它不是“规模小了就掉队”的常识路线。超长上下文上,36B 给到 512K,这不是“能对话”,而是把应用门槛往上抬,面向复杂检索、长文档推理与 Agent 工作流更有用。RefusalBench(拒答测试)这一栏,他们给出 SOTA(目前最高分)的表述,而 Hermes 4 的该项未公布。更刺眼的,是安全审查限制的差异,集中式体系里往往存在统一审查卡脖子,而开发者在这里可以自定义安全边界,自由度更高。你要是把这点当成“合规口味差异”,那就会错过它的产业含义,这是一种控制权转移。

利益拆解要落到两个层面,一个是技术控制权,一个是商业控制权。技术控制权上,去中心化训练让“模型生产能力”不再完全绑定少数中心化算力与训练平台。过去你想做训练,要么租算力,要么接供应链,训练过程高度依赖单一组织的治理。现在通过 Psyche 用全球 24 节点协作,训练网络本身就像一条可以被多方接入的生产线。说白了,门槛从“拿得到 GPU”部分迁移到“你能否参与并稳定协作这个网络”。这会削弱少数平台对训练产能的垄断,提升边缘参与者的议价空间。你想想看,这类网络越成熟,模型更新节奏越可能加快,供应链越难被单点卡死。

商业控制权上,Apache 2.0 的开源许可是底盘,Hermes 4.3 明确是零限制商用。过去开源模型的“商用能力”常常被各种条款间接约束,或者在工程部署上用安全策略做软性拦截。这里他们把“可以用”写得非常硬。更有意思的是,搭配 OpenClaw。原文给的时间点很明确,OpenClaw 在 2026.4.29 刚发新版,而 Hermes 4.3 原生支持。OpenClaw 的承诺也很工程化:原生支持 Discord 飞书 微信,记忆系统像 Wiki 一样懂你,数据不出门、不限量、不审查。你要把这些话换成行业现实翻译,它意味着 Agent 可以自托管,意味着客户不必把数据交给第三方服务端,也不必在服务端接受统一审查。ChatGPT Pro 一个月 $200?这套方案标的是免费。这里的冲突点不在“谁更聪明”,在“谁掌握数据路径与部署路径”。谁控制路径,谁就控制成本曲线,成本曲线决定生意能不能长期存在。

这一切落到终局预判上,就会变得冷酷。第一,去中心化训练如果能持续做到效率持平乃至略优,参数缩减的逻辑会被强化,36B 干翻自家 70B 的对比就不只是营销,它是在给行业一个信号,规模堆砌的边际效益正在被压缩。第二,512K 上下文与 RefusalBench 的 SOTA叙述,意味着小参数模型在对齐与长上下文应用上也能拿到更高性价比,这会改变很多团队的选型惯性。第三,Apache 2.0 零限制加自定义安全边界,再叠加 OpenClaw 的自托管 Agent 组合,会把“模型产品”从云端服务向本地化、自治化迁移。你以为这是功能升级,其实是权力回流。

所以结尾不绕弯。去中心化不是换个口号,它是把训练与部署两道关卡重新定价,一旦效率和能力同时站稳,旧的集中式生产线就会在成本与节奏上先被边缘网络挤出竞争半径。行业的宿命很简单,下一代不是谁更会堆算力,而是谁更会把生产权从中心拿回来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5月8日,国内成品油价格将调整

5月8日,国内成品油价格将调整

海峡网
2026-05-02 10:18:06
影帝这么矮小!五一假期梁朝伟现身南京,身高与随性穿搭引发热议

影帝这么矮小!五一假期梁朝伟现身南京,身高与随性穿搭引发热议

火山詩话
2026-05-02 08:30:27
回不去台岛了?赖清德刚离境,洪秀柱咬死8个字,大陆喊话台当局

回不去台岛了?赖清德刚离境,洪秀柱咬死8个字,大陆喊话台当局

晓帝爱八卦
2026-05-04 13:55:47
刘国正谈国乒男团两连败:王楚钦表现正常,林诗栋起伏还是太大了,比赛还没结束,一切都有可能,国乒男团已没有侥幸余地

刘国正谈国乒男团两连败:王楚钦表现正常,林诗栋起伏还是太大了,比赛还没结束,一切都有可能,国乒男团已没有侥幸余地

潇湘晨报
2026-05-04 10:07:18
他若不死必是十大元帅之首?毛主席:他比我厉害十倍

他若不死必是十大元帅之首?毛主席:他比我厉害十倍

小豫讲故事
2026-05-04 06:00:15
公安部提醒:换身份证后别急着走!这3个关键步骤多数人忽略

公安部提醒:换身份证后别急着走!这3个关键步骤多数人忽略

老特有话说
2026-05-04 16:04:22
80后家长发明“防早恋”发型,女儿面如死灰,网友都看不下去了

80后家长发明“防早恋”发型,女儿面如死灰,网友都看不下去了

妍妍教育日记
2026-04-27 09:20:13
美军中东基地战后惨状曝光:预警机被腰斩、控制中心被炸,6座雷达罩被摧毁5个

美军中东基地战后惨状曝光:预警机被腰斩、控制中心被炸,6座雷达罩被摧毁5个

红星新闻
2026-05-03 17:21:14
75岁陈百祥夫妇豪宅宴客,内地名厨带海鲜赴港,别墅外景气派不凡

75岁陈百祥夫妇豪宅宴客,内地名厨带海鲜赴港,别墅外景气派不凡

小俎娱乐
2026-05-04 14:46:27
化痰第一名!吃三天扫光肺里脏东西,比梨汤管用多了!

化痰第一名!吃三天扫光肺里脏东西,比梨汤管用多了!

宝哥精彩赛事
2026-05-03 21:36:21
一辆开了近17万公里的东莞牌丰田兰德酷路泽拍卖,拍出19万

一辆开了近17万公里的东莞牌丰田兰德酷路泽拍卖,拍出19万

天天话事
2026-05-04 08:31:26
你见过戾气最重的人是啥样?网友:别说自己过得好,没人想看你好

你见过戾气最重的人是啥样?网友:别说自己过得好,没人想看你好

带你感受人间冷暖
2026-05-03 02:08:30
突发!一艘油轮在阿联酋附近海域遭不明飞弹袭击!美军4日上午将有重大行动,“由特朗普亲自指示”,伊朗:任何干涉都将被视为违反停火

突发!一艘油轮在阿联酋附近海域遭不明飞弹袭击!美军4日上午将有重大行动,“由特朗普亲自指示”,伊朗:任何干涉都将被视为违反停火

每日经济新闻
2026-05-04 11:08:19
不要错过!5月4日下午17:00比赛!中央5套CCTV5、CCTV5+直播表

不要错过!5月4日下午17:00比赛!中央5套CCTV5、CCTV5+直播表

宝哥精彩赛事
2026-05-04 10:36:29
Skip:我从未在抢7大战中信任过哈登,他的队友带飞了他

Skip:我从未在抢7大战中信任过哈登,他的队友带飞了他

林子说事
2026-05-04 11:05:36
香港老板含泪述:当初劝我别卖大陆摩托的朋友,现在天天求我留车

香港老板含泪述:当初劝我别卖大陆摩托的朋友,现在天天求我留车

蓝色海边
2026-05-03 17:04:18
骑士4-3猛龙!阿特金森承认一事实,米切尔赛后谈哈登也把话挑明

骑士4-3猛龙!阿特金森承认一事实,米切尔赛后谈哈登也把话挑明

鱼崖大话篮球
2026-05-04 12:15:23
各科医生最想跟你说的大实话,很有用!收藏好常看看

各科医生最想跟你说的大实话,很有用!收藏好常看看

华人星光
2026-04-23 12:00:20
1993年,张学良被拜访:看到冯巩十分惊讶,为东北题了3个字

1993年,张学良被拜访:看到冯巩十分惊讶,为东北题了3个字

历史龙元阁
2026-05-03 17:55:10
伊朗武装部队称将打击接近或进入霍尔木兹海峡的美军

伊朗武装部队称将打击接近或进入霍尔木兹海峡的美军

新华社
2026-05-04 14:37:11
2026-05-04 17:27:00
呼呼历史论
呼呼历史论
分享有趣的历史
389文章数 16950关注度
往期回顾 全部

科技要闻

OpenAI“复活”了QQ宠物,网友直接玩疯

头条要闻

宇树机器人在美坐飞机电池超标被拆卸暂扣 致航班延误

头条要闻

宇树机器人在美坐飞机电池超标被拆卸暂扣 致航班延误

体育要闻

骑士破猛龙:加雷特·阿伦的活力

娱乐要闻

张敬轩还是站上了英皇25周年舞台

财经要闻

魔幻的韩国股市,父母给婴儿开户买股票

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

手机
艺术
家居
房产
公开课

手机要闻

消息称小米Q5机型非MIX 5,而是小米18系列

艺术要闻

300米!重庆解放碑区在建第一高楼,冲刺竣工!

家居要闻

灵动实用 生活艺术场

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版