网易首页 > 网易号 > 正文 申请入驻

DeepSeek2026年初发表重要论文,撼动AI基础架构

0
分享至



这个2016年由微软亚洲研究院何恺明团队提出的技术,在十年后迎来了一次硬核升级。



但模型越做越大,参数越来越多,问题就来了。

信息在神经网络里传递,跟高速路上堵车没两样,越到后面越混乱。

字节跳动2024年推出的超连接技术,本来想多开几条“车道”缓解拥堵。



可车道多了没规矩,大规模训练时反而更不稳定。

DeepSeek的mHC技术就聪明多了,给这些车道加了“流形约束”。

这词听着挺学术,其实就是用数学方法给信息流动定规矩。

他们用30亿、90亿和270亿参数的模型做了测试。



结果很惊喜,训练稳定性提上去了,可扩展性也更好,关键是没多花多少计算成本。

本来想简单解释下原理,但后来发现,这技术本质就是给老架构做了次“精装修”,既保留优势又补了短板,确实够巧妙。

mHC技术的诞生,说到底是现实压力逼出来的。

美国的OpenAI、谷歌这些巨头,训练一个模型动辄砸几亿甚至十几亿美元。



中国AI企业可没这条件,美国的芯片出口管制卡得很严。

商务部2025年9月就发起了反歧视调查,那些限制出口、限制投资的措施,让高端GPU成了稀缺资源。

无奈之下,中国企业只能另辟蹊径。DeepSeek之前发布的R1模型,训练成本才29.4万美元。

这个数字传到硅谷,不少工程师都觉得不可思议。



要知道,美国同行的同类模型成本可是这个数的几十倍。

如此看来,低成本路线不是选择题,是必答题。

mHC技术不是小修小补,而是从底层架构上做了系统性优化。

这路子走对了,毕竟不是所有企业都能烧钱拼算力,用技术巧劲降低门槛,才能让更多人参与到AI创新里来。



更让人意外的是,DeepSeek把这核心技术公开发表了。

HuggingFace可是NLP领域的开源重地,上面有海量预训练模型和数据集,全球开发者都在这交流。



这在学术界是惯例,意味着他是整个项目的主导者和把关人。

一个公司CEO能亲自扎进硬核研发,这在全球AI圈都不多见。

这几年中国AI企业的心态变了。以前总想着“闷声发大财”,现在更愿意把成果分享出来。

智谱AI、通义千问都开源了不少模型,截至2025年8月,中国开源模型的累计下载量已经超过美国。



开源不是吃亏,反而能吸引更多人才,通过社区反馈加速技术迭代。

这次mHC技术一出来,大家都在盼着他们的R2模型。2026年才刚开始,AI圈的竞争就已经火药味十足。



中国AI企业靠着底层技术创新,在算力受限的情况下走出了自己的路。

低成本不是妥协,开源也不是让利,这些都是构建核心竞争力的聪明做法。未来,mHC技术能不能在商业化应用中站稳脚跟,R2模型能不能带来更多惊喜,都值得期待。

但可以肯定的是,中国AI已经不是只能跟跑的角色。

靠着这种“逆境求生”的创新力和开放共享的格局,在和美国巨头的比拼中,一定能占据一席之地。



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山东该反省了:GDP全国第三,民风淳朴,为何在舆论场任人宰割?

山东该反省了:GDP全国第三,民风淳朴,为何在舆论场任人宰割?

道总有理
2026-05-27 20:34:29
“香会”25年,中美两大主角主导安全对话“音量”

“香会”25年,中美两大主角主导安全对话“音量”

环球网资讯
2026-06-01 06:36:08
外表光鲜亮丽,实则是流氓头子、家暴恶魔,这4位男星太令人作呕

外表光鲜亮丽,实则是流氓头子、家暴恶魔,这4位男星太令人作呕

天马幸福的人生
2026-04-24 01:39:41
凭什么一集20分钟,却让观众直呼“比40集的剧还下饭”?

凭什么一集20分钟,却让观众直呼“比40集的剧还下饭”?

阿废冷眼观察所
2026-05-31 21:38:11
哈曼:如果是我就会签拉什福德而非戈登,拜仁应该买他

哈曼:如果是我就会签拉什福德而非戈登,拜仁应该买他

懂球帝
2026-06-01 21:47:19
继德国之后,英国也贴出中文标语?中国游客为何屡遭专属中文歧视

继德国之后,英国也贴出中文标语?中国游客为何屡遭专属中文歧视

贱议你读史
2026-06-01 20:30:03
刚官宣就撞车!比亚迪智驾兜底首案来了,车主已报案

刚官宣就撞车!比亚迪智驾兜底首案来了,车主已报案

北纬的咖啡豆
2026-05-31 14:40:49
最新:苍南中小学招生计划出炉!

最新:苍南中小学招生计划出炉!

在苍南
2026-06-01 13:20:50
研究发现:体质好的人,一般有6个特征,能占4个,就很不错

研究发现:体质好的人,一般有6个特征,能占4个,就很不错

蜉蝣说
2026-05-19 21:58:27
英媒:伊朗破坏20处美军设施

英媒:伊朗破坏20处美军设施

参考消息
2026-06-01 21:26:25
乔布斯被印上1美元硬币:年薪1美元的创始人,死后成了"货币"

乔布斯被印上1美元硬币:年薪1美元的创始人,死后成了"货币"

赛博兰博
2026-05-13 09:15:49
“指纹锁”退出中国家庭?开锁师傅说了实话,我连夜换回了铁将军

“指纹锁”退出中国家庭?开锁师傅说了实话,我连夜换回了铁将军

巢客HOME
2026-04-08 15:48:09
布拉德·皮特坦言:孩子不用我的姓,这让他最难受

布拉德·皮特坦言:孩子不用我的姓,这让他最难受

赴一场山海啊
2026-05-31 00:35:54
法媒称萨利巴因背伤恐缺席世界杯,德尚紧急辟谣:他很好!

法媒称萨利巴因背伤恐缺席世界杯,德尚紧急辟谣:他很好!

伟少说球
2026-06-02 02:56:10
山东惊天伦理案!不止长期出轨,妻子从一开始就精心设局

山东惊天伦理案!不止长期出轨,妻子从一开始就精心设局

网络易不易
2026-05-23 17:10:06
巴西夫妇从中国来到印度,外国网友:好像从2050年穿越到1950年!

巴西夫妇从中国来到印度,外国网友:好像从2050年穿越到1950年!

怪味历史连连看
2026-05-25 23:48:52
深圳房价为什么跌得这么惨?

深圳房价为什么跌得这么惨?

流苏晚晴
2026-04-10 19:13:32
终于要来了!苹果将发布 mini 新品

终于要来了!苹果将发布 mini 新品

花果科技
2026-06-01 15:35:18
钟南山发现:能活到90岁的老人,基本在60岁,就已经不做这6事了

钟南山发现:能活到90岁的老人,基本在60岁,就已经不做这6事了

医学科普汇
2026-05-13 23:30:08
马刺重返总决赛:10个月从季后赛希望到夺冠热门

马刺重返总决赛:10个月从季后赛希望到夺冠热门

温柔且自由
2026-06-02 02:22:30
2026-06-02 03:15:00
玛丽莲萌兔
玛丽莲萌兔
玛丽莲萌兔
737文章数 239关注度
往期回顾 全部

科技要闻

黄仁勋演讲实录|40年来PC首次重设计!

头条要闻

伊朗计划彻底封锁霍尔木兹海峡 特朗普回应

头条要闻

伊朗计划彻底封锁霍尔木兹海峡 特朗普回应

体育要闻

杰威:如果我没受伤,我们能击败马刺

娱乐要闻

奚梦瑶婚礼现场图!一双儿女当花童

财经要闻

宇树过会,杭州赢麻了

汽车要闻

奇瑞集团5月销量24.8万辆 同比增长20.5% 出口18.2万辆再创新高

态度原创

房产
教育
艺术
数码
公开课

房产要闻

100亿!1371亩!海口城市更新,再爆超级项目!

教育要闻

我给她钱 换来的不是感激 而是她的谩骂

艺术要闻

吴镇写竹,清清爽爽

数码要闻

惠普推OmniDesk迷你主机:配英特尔新U支持AI加速

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版