网易首页 > 网易号 > 正文 申请入驻

DeepSeek的创始人梁文锋,连续三年收到美国方面的学术交流邀请

0
分享至

梁文锋三年没去美国,技术路线被盯上,国产大模型悄悄跑通了

从2023年到2025年,DeepSeek创始人梁文锋连续三年推掉了美国高校和研究机构发来的邀请,对方通过邮件联系他,想请他去做讲座、参加研讨会,甚至有实验室提出联合开展项目,他一律回绝了这些请求,虽然没公开说明原因,但后来大家慢慢看明白,他不是怕交流,而是担心暴露具体做法。

2025年初,DeepSeek公司把一个千卡级别的大模型,完整运行在华为昇腾芯片组成的集群上,这是全球首个实际落地的案例,过去人们认为做大模型必须用英伟达GPU,不然算力不够、训练速度太慢,但DeepSeek没有遵循这个思路,他们采用国产硬件,把服务器数量减少一半,训练成本压缩到原来五分之一,关键不在于“能用”,而是“好用”——接口完全兼容昇腾全系列产品,90%的软硬件都实现国产化,这不是临时拼凑的方案,而是经过重新设计的架构。

从2024年开始,许多中小企业和制造业公司开始采用他们的方案,之前一套大模型系统动不动就要几百万,现在几十万就能用起来,客户反馈很实际,不用调整参数,响应速度快,故障出现少,这证明技术不是空谈,确实能解决实际问题。



美国那边一开始还在限制芯片出口,到了2024年中却突然改变做法,社交平台上有人怀疑DeepSeek的数据可能有问题,实验室里很多人试着重复他们的结果,方法可以看懂,但实际操作做不出来,他们遇到的问题是硬件上的限制,却想从软件层面弄清楚怎么用更少的资源做到更多的事,临近年底中美科技协议续签之前,美国学术机构又频繁发来邀请,表面上是安排座谈交流,实际上是想了解模型压缩和分布式训练这些具体的技术细节。

梁文锋对这些邀请全都不理会,他不参加路演活动,不发宣传稿,连媒体采访也很少接受,平时就在GitHub上回复问题,半夜还在线查看压测日志,亲自调试边缘场景的bug,团队两年里换了两批人,但核心岗位还是开发、测试和适配人员,没有公关职位,也没有专门负责商务的人员,他觉得去一次座谈就等于把底层假设亮出来给别人分析,这样做不划算,他只开源接口部分,训练逻辑始终牢牢守住。

国内一些高校和企业主动来找我们,到了2025年,复旦大学、清华大学和华为公司的内部实验室开始用DeepSeek的模型做基准测试,不是因为它的名气大,而是因为它运行稳定、速度快,基本不用调整参数,在开源社区里,他们的GitHub活跃度在国内排第一,这不是靠宣传带来的流量,是用户自己选择的结果。

2026年初,有家美国科技公司的高管私下联系梁文锋,想邀请他去带队工作,梁文锋只回答一句,说中国的AI应用场景最复杂也最有发展机会,这话听起来很平常,但仔细想想挺有意思,他没有强调我们比你们强,也没有提到技术封锁或竞争对抗,只是点明一个实际情况,真正的需求在哪里,机会就在哪里。

国产芯片的出货量增长很快,信创领域的采购也在提速,DeepSeek这家公司没有专门喊口号,也没有举办发布会,但它是少数真正能做到“不需要进口替代”的企业之一,用户实际用了之后,发现它确实好用,同行尝试去模仿的时候,才意识到很难复制,创始人梁文锋三年没怎么外出,并不是在躲避什么,而是把时间花在了那些别人都不愿意做的细节上。

有人问这算不算对抗,其实不算,他没有写声明也没有发长文反驳,只是继续做自己的事,美国想通过学术渠道打听消息,他选择不参加那个游戏,他的团队不靠别人认可来生存,而是靠着用户每天调用模型、修复错误、提出需求,这些才是最实在的反馈。

到了2026年5月,大家在讨论国产大模型的事情越来越多,而DeepSeek那边还是没什么动静,他们每次更新版本的时候,连更新日志都写得简单直接,就像代码里的注释一样,没人要求他们非要证明什么,但他们已经走在前面了。

声明:取材网络、谨慎鉴别

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026年中国经济能好起来吗?一个憋了20年的问题,终于要解了

2026年中国经济能好起来吗?一个憋了20年的问题,终于要解了

柏年说政经
2026-05-09 18:00:03
RTX 5090一小时破译60%密码:MD5该退休了

RTX 5090一小时破译60%密码:MD5该退休了

我是一个粉刷匠2
2026-05-09 15:53:04
酒吧大屏专属欢迎!向佑新女友背景曝光,难怪向太执意不同意

酒吧大屏专属欢迎!向佑新女友背景曝光,难怪向太执意不同意

晓岇就是我
2026-05-10 05:32:42
一句“别染发”上热搜,染发产品成抽检不合规榜单“常客”

一句“别染发”上热搜,染发产品成抽检不合规榜单“常客”

新京报
2026-05-08 16:20:47
凯特花园派对给足惊喜!可生图骗不了人,威廉同步瘦,状态太真实

凯特花园派对给足惊喜!可生图骗不了人,威廉同步瘦,状态太真实

坠入二次元的海洋
2026-05-10 09:11:40
世体回顾C罗谈姆巴佩:皇马本来就强,签下他不见得会更进一步

世体回顾C罗谈姆巴佩:皇马本来就强,签下他不见得会更进一步

懂球帝
2026-05-10 20:37:16
丈夫出事,50岁被迫放低身段出来赚钱的李小冉,豪门梦终还是碎了

丈夫出事,50岁被迫放低身段出来赚钱的李小冉,豪门梦终还是碎了

一盅情怀
2026-05-10 17:27:17
医生发现:过了六十岁,凡是白发少的老人,大多都有这2个共性

医生发现:过了六十岁,凡是白发少的老人,大多都有这2个共性

垚垚分享健康
2026-05-03 15:25:09
杨思琦回应李家鼎风波,被冤枉15年平方拒落井下石,心疼鼎爷消瘦

杨思琦回应李家鼎风波,被冤枉15年平方拒落井下石,心疼鼎爷消瘦

开开森森
2026-05-10 19:52:51
“当律师遇到了用文言文交流的客户…?”哈哈哈咨询是按字数收费吗!

“当律师遇到了用文言文交流的客户…?”哈哈哈咨询是按字数收费吗!

脆皮先生
2026-05-10 19:37:42
看王曼昱全程冷着脸,我真的特别难受。

看王曼昱全程冷着脸,我真的特别难受。

小光侃娱乐
2026-03-13 07:55:12
赫内斯谈克罗斯:多要一欧元,那就得走

赫内斯谈克罗斯:多要一欧元,那就得走

懂球帝
2026-05-10 17:07:24
离婚不离家?看到陈思诚和阮巨现状,才知道佟丽娅的做法有多高明

离婚不离家?看到陈思诚和阮巨现状,才知道佟丽娅的做法有多高明

原梦叁生
2026-05-09 05:05:40
郑欣宜近照笑容灿烂,戴翡翠项链瘦了很多,变漂亮了

郑欣宜近照笑容灿烂,戴翡翠项链瘦了很多,变漂亮了

素素娱乐
2026-05-09 09:54:48
王博:大家的斗志要比第一场要好 孙铭徽是否复出回杭州看训练情况

王博:大家的斗志要比第一场要好 孙铭徽是否复出回杭州看训练情况

狼叔评论
2026-05-10 23:10:04
解放前特务用很小的电台就能向台湾发报,可如今为什么没法做到?

解放前特务用很小的电台就能向台湾发报,可如今为什么没法做到?

宅家伍菇凉
2026-05-09 09:41:53
比亚迪李云飞最新发声:不胜其烦

比亚迪李云飞最新发声:不胜其烦

金融界
2026-05-09 16:54:28
不满未被郑丽文提名 台中深蓝老将愤而“退党”参选 台中选举迎变数

不满未被郑丽文提名 台中深蓝老将愤而“退党”参选 台中选举迎变数

阿天爱旅行
2026-05-10 15:30:28
先访日再访华?美国老套路被看穿,中方回应硬气到底

先访日再访华?美国老套路被看穿,中方回应硬气到底

安珈使者啊
2026-05-10 09:34:13
华为Mate90 Pro Max全面曝光!3nm麒麟+7500mAh固态电池

华为Mate90 Pro Max全面曝光!3nm麒麟+7500mAh固态电池

小柱解说游戏
2026-05-10 03:54:13
2026-05-10 23:32:49
爱看剧的阿峰
爱看剧的阿峰
更多精彩影视等你观看
218文章数 14118关注度
往期回顾 全部

财经要闻

白酒大逃杀

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

科技要闻

DeepSeek融资,改写所有人的估值

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

时尚
健康
数码
公开课
军事航空

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

干细胞能让人“返老还童”吗

数码要闻

Q1中国客厅智能设备线上市场:显示设备销量全线下滑

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗革命卫队深夜警告

无障碍浏览 进入关怀版