![]()
| 文心
首发 | 公众号云海观星
【云海观星】—— 专注于AI和互联网科技,做您数字时代的陪伴者,一起学习、见证成长。
去年DeepSeek刚推出的时候,就曾在行业里引发巨大的热议,甚至引发行业大佬们集体震惊!
一个搞量化的人,和AI貌似没什么交集的人,竟然颠覆了大模型!
你以为这就完了?
最近,梁文锋又丢出王炸!
2026 开年第一天,DeepSeek 扔出的新论文就炸了锅 —— 那个低调到搜不到几张照片的梁文锋,带着团队把 AI 的 “承重墙” 给换了。
这事得先掰明白:AI 模型里藏着无数条 “数据公路”,残差连接就是维持交通的核心,相当于公路的地基。之前美国人搞的 “超连接” 想拓宽公路提升速度,结果没了规矩,数据一跑就堵车、追尾,模型越大越容易 “瘫痪”。
一时间,这种问题成了瓶颈,没人能解决。
可是没过多久,梁文锋就扔出王炸!
梁文锋团队的新招叫 mHC 架构,说白了就是给这些公路装了套 “智能交通系统”,用数学规则把车流框在安全范围内,既不挡速度,又能避免事故。
他们给连接矩阵加了个约束,要求每行每列的权重加起来都是 1,就像规定每条车道的车流量必须均衡,这样数据跑再远也不会 “超速失控”,连训练时的能量都不会凭空浪费。
![]()
更妙的是,这套系统用成熟的算法做调度,额外成本几乎可以忽略,3B 到 27B 参数的模型都能稳跑。
这已经不是梁文锋第一次 “不按常理出牌” 了。去年《自然》评他为全球十大科学人物,直接喊他 “科技颠覆者”,理由很实在:别人训练 AI 要花 10 块钱,他的方法 1 块钱就够,还用中低端芯片就能跑起来。
要知道这可是在芯片受限的情况下,DeepSeek 愣是靠算法优化闯出了路。
更难得的是,他们把核心技术全开源了,就像把修路的图纸公之于众,谁都能来学、来用,一下子带动中美好多企业跟着开放模型。
9 月份的时候,他们的 R1 模型还成了首个通过《自然》同行评审的大模型,8 位审稿人提了上百条意见,从单词细节到安全评估全过了关,《自然》说这是打破了 AI 圈 “吹牛不打草稿” 的怪圈。
有人说这是 “运气好”,可了解梁文锋的人都知道,他从来都是 “死磕底层” 的脾气。这位从广东湛江农村走出来的学霸,父母都是小学老师,从小就抱着数理化课本不放,浙江大学毕业后没去考公编,反而扎进了 AI 和金融的交叉领域。
后来创办幻方量化做到千亿规模,手握一万块 GPU,却在 2023 年突然转身做 DeepSeek。别人都在做聊天机器人、文生图这些 “快钱生意”,他偏要啃大模型的硬骨头,说 “应用门槛迟早会低,但底层技术得有人先搞定”。
他的公司也透着股 “反套路” 的劲儿:没有 KPI,核心岗位全是刚毕业的年轻人,招人的唯一标准是 “热爱”。
有个中学生还成了 R1 论文的作者,这在讲究资历的科研圈简直不敢想。梁文锋自己更是把低调刻进骨子里,穿普通衣服,背平价包,除了技术会议几乎不露面,却会亲自下场给论文署名,跟团队一起改算法细节。
去年 DeepSeek 披露过一组数据,他们用 H800 GPU 跑服务,通过白天满负荷、晚上降节点的调度,理论利润率能到 545%,可他们转头就把夜间 API 价格砍到 25 折,就为了让更多人用得起。
这会儿肯定有人问:搞这些底层技术有啥用?其实答案早写在了现实里。
过去我们总说 “中国能把 1 做到 100”,可梁文锋用行动证明,我们也能搞 0 到 1 的原创。
当美国靠芯片垄断卡脖子时,他的团队用算法把训练成本降到十分之一;当行业都在炒概念时,他们用同行评审的硬成果说话;当别人捂着技术当宝贝时,他们开源共享搭建生态。就像《自然》说的,DeepSeek 就是中国科技从 “模仿者” 转向 “创新者” 的缩影。
![]()
更动人的是梁文锋身上的那股 “平静劲儿”。在这个追风口、比流量的时代,他能沉下心花几年改架构,不搞营销不蹭热度,只靠技术说话。这种 “不疾而速” 的定力,或许比技术突破本身更珍贵。
毕竟科技竞争从来不是短跑,而是长跑,那些愿意蹲下来修补地基的人,才真正决定了赛道能延伸多远。
当 AI 圈还在为 “谁的模型更快” 争论时,梁文锋已经告诉我们:真正的领先,是让后来者都能站在你的肩膀上往前跑。
这大概就是中国科研最该有的样子 —— 不喧哗,自有声。
本文审核声明:本文内容已进行合规核查,确保符合国家法律法规和平台规定,坚持正面引导,传播正能量。文中观点基于公开信息进行行业观察探讨,旨在促进行业健康发展。图片源于网络,仅做分享使用,如侵权请联系删除。文章仅做分享交流,无任何商业目的和行为,如有不妥联系删除。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.