网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

DeepSeek2026年初发表重要论文，撼动AI基础架构

2026-01-08 00:55:26　来源: 玛丽莲萌兔

四川举报

0

分享至

这个2016年由微软亚洲研究院何恺明团队提出的技术，在十年后迎来了一次硬核升级。

但模型越做越大，参数越来越多，问题就来了。

信息在神经网络里传递，跟高速路上堵车没两样，越到后面越混乱。

字节跳动2024年推出的超连接技术，本来想多开几条“车道”缓解拥堵。

可车道多了没规矩，大规模训练时反而更不稳定。

DeepSeek的mHC技术就聪明多了，给这些车道加了“流形约束”。

这词听着挺学术，其实就是用数学方法给信息流动定规矩。

他们用30亿、90亿和270亿参数的模型做了测试。

结果很惊喜，训练稳定性提上去了，可扩展性也更好，关键是没多花多少计算成本。

本来想简单解释下原理，但后来发现，这技术本质就是给老架构做了次“精装修”，既保留优势又补了短板，确实够巧妙。

mHC技术的诞生，说到底是现实压力逼出来的。

美国的OpenAI、谷歌这些巨头，训练一个模型动辄砸几亿甚至十几亿美元。

中国AI企业可没这条件，美国的芯片出口管制卡得很严。

商务部2025年9月就发起了反歧视调查，那些限制出口、限制投资的措施，让高端GPU成了稀缺资源。

无奈之下，中国企业只能另辟蹊径。DeepSeek之前发布的R1模型，训练成本才29.4万美元。

这个数字传到硅谷，不少工程师都觉得不可思议。

要知道，美国同行的同类模型成本可是这个数的几十倍。

如此看来，低成本路线不是选择题，是必答题。

mHC技术不是小修小补，而是从底层架构上做了系统性优化。

这路子走对了，毕竟不是所有企业都能烧钱拼算力，用技术巧劲降低门槛，才能让更多人参与到AI创新里来。

更让人意外的是，DeepSeek把这核心技术公开发表了。

HuggingFace可是NLP领域的开源重地，上面有海量预训练模型和数据集，全球开发者都在这交流。

这在学术界是惯例，意味着他是整个项目的主导者和把关人。

一个公司CEO能亲自扎进硬核研发，这在全球AI圈都不多见。

这几年中国AI企业的心态变了。以前总想着“闷声发大财”，现在更愿意把成果分享出来。

智谱AI、通义千问都开源了不少模型，截至2025年8月，中国开源模型的累计下载量已经超过美国。

开源不是吃亏，反而能吸引更多人才，通过社区反馈加速技术迭代。

这次mHC技术一出来，大家都在盼着他们的R2模型。2026年才刚开始，AI圈的竞争就已经火药味十足。

中国AI企业靠着底层技术创新，在算力受限的情况下走出了自己的路。

低成本不是妥协，开源也不是让利，这些都是构建核心竞争力的聪明做法。未来，mHC技术能不能在商业化应用中站稳脚跟，R2模型能不能带来更多惊喜，都值得期待。

但可以肯定的是，中国AI已经不是只能跟跑的角色。

靠着这种“逆境求生”的创新力和开放共享的格局，在和美国巨头的比拼中，一定能占据一席之地。

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

超市卸猪肉时遭狗多次啃食，员工却视而不见，店长：气炸了

星视频 2026-06-01 10:19:01
92 跟贴 92
要求配偶为学校在职在编优秀博士，贵州大学回应“萝卜岗”招聘质疑：条件设置不当，已终止招聘

都市快报橙柿互动 2026-06-01 09:19:03
10704 跟贴 10704

张镇麟太香了！

新民晚报 2026-06-01 09:08:06
271 跟贴 271

鲜奶雪糕包装印“不加一滴水”配料表首位竟是水厂家：系旧包装，已改名“一滴水”

上游新闻 2026-05-29 18:03:05
1877 跟贴 1877
CBA总决赛第四场2日晚打响，上海距24年后再登顶仅一步之遥

齐鲁壹点 2026-06-01 16:18:25
53 跟贴 53

收评：创业板指跌2.15% 科创50指数跌5%

财联社 2026-06-01 15:08:20
234 跟贴 234

车辆“发福”，车位需扩容？

海外网 2026-06-01 06:43:14
823 跟贴 823
巴菲特“接班人”首笔68亿美元大单押注房地产分析师：他在赌周期反转

红星新闻 2026-06-01 19:30:39
58 跟贴 58

NBA历史首对父子组合！布伦森父子代表同一球队出战总决赛

北青网-北京青年报 2026-06-01 20:22:21
19 跟贴 19
幼儿在公园误舔了一口叶子中毒入院

澎湃新闻 2026-06-01 19:48:49
263 跟贴 263
男子惊险从夹缝中逃生。网友：幸好走路没看手机

中原网 2026-06-01 14:40:38
57 跟贴 57
新疆托克逊县发生5.0级地震，这些谣言勿信勿传（2026·06·01）

今日辟谣 2026-06-01 18:21:07
2 跟贴 2
夜空中最亮的星

国际在线 2026-05-29 08:57:49
1522 跟贴 1522
美国番茄价格大涨，美厨师：购买时“需反复权衡”

环球网资讯 2026-06-01 06:36:08
150 跟贴 150
吃片皮鸭、喝红酒、品甜点…夏日，上海市集的烟火气和氛围感如何“炼成”？

上观新闻 2026-06-01 07:34:08
961 跟贴 961
中国市场长期吸引力持续增强

经济日报 2026-06-01 06:56:05
25 跟贴 25
不写论文也能拿博士学位，多元评价不意味着变相放水 | 新京报快评

新京报评论 2026-06-01 18:58:08
23 跟贴 23
一边刷手机一边崩溃：被连接绑架的年轻人，连喊累都不敢出声

心事寄山海 2026-06-02 02:04:44
0 跟贴 0
稻城亚丁“省道”，车票收入超1亿元

中国新闻周刊 2026-06-01 20:10:11
0 跟贴 0
他用冷暴力分手，竟和公司改用VoIP的3个理由一样残忍

云朵偷喝奶茶 2026-06-02 02:50:57
0 跟贴 0
一只“死鸡”，能骗走你多少钱？

虎嗅APP 2026-06-02 02:43:13
0 跟贴 0

山东该反省了：GDP全国第三，民风淳朴，为何在舆论场任人宰割？

山东该反省了：GDP全国第三，民风淳朴，为何在舆论场任人宰割？

道总有理

2026-05-27 20:34:29

“香会”25年，中美两大主角主导安全对话“音量”

“香会”25年，中美两大主角主导安全对话“音量”

环球网资讯

2026-06-01 06:36:08

外表光鲜亮丽，实则是流氓头子、家暴恶魔，这4位男星太令人作呕

外表光鲜亮丽，实则是流氓头子、家暴恶魔，这4位男星太令人作呕

天马幸福的人生

2026-04-24 01:39:41

凭什么一集20分钟，却让观众直呼“比40集的剧还下饭”？

凭什么一集20分钟，却让观众直呼“比40集的剧还下饭”？

阿废冷眼观察所

2026-05-31 21:38:11

哈曼：如果是我就会签拉什福德而非戈登，拜仁应该买他

哈曼：如果是我就会签拉什福德而非戈登，拜仁应该买他

懂球帝

2026-06-01 21:47:19

继德国之后，英国也贴出中文标语？中国游客为何屡遭专属中文歧视

继德国之后，英国也贴出中文标语？中国游客为何屡遭专属中文歧视

贱议你读史

2026-06-01 20:30:03

刚官宣就撞车！比亚迪智驾兜底首案来了，车主已报案

刚官宣就撞车！比亚迪智驾兜底首案来了，车主已报案

北纬的咖啡豆

2026-05-31 14:40:49

最新：苍南中小学招生计划出炉！

最新：苍南中小学招生计划出炉！

在苍南

2026-06-01 13:20:50

研究发现：体质好的人，一般有6个特征，能占4个，就很不错

研究发现：体质好的人，一般有6个特征，能占4个，就很不错

蜉蝣说

2026-05-19 21:58:27

英媒：伊朗破坏20处美军设施

参考消息

2026-06-01 21:26:25

乔布斯被印上1美元硬币：年薪1美元的创始人，死后成了"货币"

乔布斯被印上1美元硬币：年薪1美元的创始人，死后成了"货币"

赛博兰博

2026-05-13 09:15:49

“指纹锁”退出中国家庭？开锁师傅说了实话，我连夜换回了铁将军

“指纹锁”退出中国家庭？开锁师傅说了实话，我连夜换回了铁将军

巢客HOME

2026-04-08 15:48:09

布拉德·皮特坦言：孩子不用我的姓,这让他最难受

布拉德·皮特坦言：孩子不用我的姓,这让他最难受

赴一场山海啊

2026-05-31 00:35:54

法媒称萨利巴因背伤恐缺席世界杯，德尚紧急辟谣：他很好！

法媒称萨利巴因背伤恐缺席世界杯，德尚紧急辟谣：他很好！

伟少说球

2026-06-02 02:56:10

山东惊天伦理案！不止长期出轨，妻子从一开始就精心设局

山东惊天伦理案！不止长期出轨，妻子从一开始就精心设局

网络易不易

2026-05-23 17:10:06

巴西夫妇从中国来到印度，外国网友：好像从2050年穿越到1950年！

巴西夫妇从中国来到印度，外国网友：好像从2050年穿越到1950年！

怪味历史连连看

2026-05-25 23:48:52

深圳房价为什么跌得这么惨？

流苏晚晴

2026-04-10 19:13:32

终于要来了！苹果将发布 mini 新品

终于要来了！苹果将发布 mini 新品

花果科技

2026-06-01 15:35:18

钟南山发现：能活到90岁的老人，基本在60岁，就已经不做这6事了

钟南山发现：能活到90岁的老人，基本在60岁，就已经不做这6事了

医学科普汇

2026-05-13 23:30:08

马刺重返总决赛：10个月从季后赛希望到夺冠热门

马刺重返总决赛：10个月从季后赛希望到夺冠热门

温柔且自由

2026-06-02 02:22:30

玛丽莲萌兔

玛丽莲萌兔

737文章数 239关注度

往期回顾全部

科技要闻

黄仁勋演讲实录|40年来PC首次重设计！

头条要闻

伊朗计划彻底封锁霍尔木兹海峡特朗普回应

头条要闻

伊朗计划彻底封锁霍尔木兹海峡特朗普回应

体育要闻

杰威：如果我没受伤，我们能击败马刺

娱乐要闻

奚梦瑶婚礼现场图！一双儿女当花童

财经要闻

宇树过会，杭州赢麻了

汽车要闻

奇瑞集团5月销量24.8万辆同比增长20.5% 出口18.2万辆再创新高

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

教育

艺术

数码

公开课

房产要闻

100亿！1371亩！海口城市更新，再爆超级项目！

教育要闻

我给她钱换来的不是感激而是她的谩骂

艺术要闻

吴镇写竹，清清爽爽

数码要闻

惠普推OmniDesk迷你主机：配英特尔新U支持AI加速

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版