![]()
你搜梁文锋的时候,屏幕上跳出来的信息翻来覆去就两样。一样是DeepSeek的论文和融资新闻。另一样是“低调”“不爱说话”“不接受采访”。社交媒体上找不到他的账号,专访视频更是零。这两年最火的AI公司创始人,在互联网上的痕迹比一个普通程序员还干净。
但如果你以为他是个社恐,那这个误会大了。他不爱说话,只是不爱跟媒体说话。该说的,他都换成了别的方式,那是什么呢?
其中最让人好奇的一件事是:DeepSeek招人,不看经验,不看背景。梁文锋原话是:我们看重的是热爱和扎实的基础能力,其他都没那么重要。大厂HR看到这句话估计得疯。不看出身、不看经历、不看你之前在哪家公司,你招什么人?
但他们真的就是这么招的。
他要找的,是那种进了公司之后不需要管的人
梁文锋的管理方式比他的招聘标准更离谱。DeepSeek没有层级,没有审批。员工想用训练集群的显卡可以随时调用,不需要向任何人汇报。一个实习生叫Jingyang Yuan,在DeepSeek实习期间独立完成了一篇顶会论文,署名第一作者。实习生做自己的研究,成果能发顶会,署名一作。这件事放在任何一个大厂都不可能发生,流程上根本走不通。但在DeepSeek,就这么发生了。
实习生能直接跟梁文锋沟通。研发人员能自己决定怎么用训练资源。没有工位、没有打卡、没有周报。一家没有层级、没有审批、没有汇报的公司,放在AI行业里几乎是异类。但梁文锋就是这么管的。他的逻辑很简单:你要相信做这件事的人知道自己该干什么。不信就别招,招了就别管。
有人问他,不怕管不住吗。他说:“管不住说明你招错人了。我招的是知道自己该干什么的人,不是需要我告诉他该干什么的人。”
他在进DeepSeek之前,先给自己铺了条路
梁文锋的履历没有戏剧性。17岁考进浙江大学,读电子信息工程,硕士毕业。导师评价他“文静内敛,典型的技术男风格”。
2009年他以实习生身份进了一家做视频编解码的公司,月薪16000元。但他在那家公司待了不到两年就走了。不是干得不好,是他在业余时间研究的东西——量化投资,已经成熟了,可以盈利了。他跟老板说:“这块研究已经成熟了,可以盈利了。”然后就走了。
2010年毕业之后他没有继续待在技术圈,而是转头去做量化投资。跟几个浙大校友成立了幻方量化,几年内把公司做到国内量化私募头部,管理规模突破百亿。他用量化交易赚的钱全砸进AI算力基建,2019年投2亿建了萤火一号,2021年再投10亿建了萤火二号,搭载了一万张A100显卡。这些算力后来成了DeepSeek的底牌。
别人还在融资买卡的时候,他已经有一万张A100在跑了。
为什么把最强的东西免费送人
DeepSeek最让行业看不懂的操作是开源。R1发布后,全世界都能免费下载、免费商用。一个非洲开发者用R1搭了一个农业病害诊断系统。北大的团队用它做了一个AI数学教练,帮学生解题。这些事在商业逻辑上说不通。你花了那么多钱训练的东西,凭什么给别人随便用?
投资人不理解,问护城河在哪。梁文锋回了一句:“在颠覆性的技术面前,闭源形成的护城河是短暂的,我们把价值沉淀在团队上。开源更像一个文化行为,而非商业行为,给予其实是一种额外的荣誉。”
2025年9月,R1登上了《自然》杂志封面,成为全球首个经同行评审的主流开源大模型。一篇关于模型设计的论文能发Nature封面,这件事本身就把DeepSeek从中国AI圈拉到了全球学术舞台。他不是用AI赚钱,他是用赚钱做AI。这两件事的顺序不能反。
不爱说话的人,用代码说话
2026年2月,DeepSeek发了一篇新论文,提出一种新的注意力机制NSA。梁文锋参与编写,并亲自上传了论文。整数智能的CEO在直播中说:“创始人冲在前线亲自解决问题,了解每个岗位的需求,从而更高效地配置资源,非常值得借鉴。”
一个创始人如果只有低调,那叫不存在。一个创始人如果低调但所有关键节点都在场,发论文的时候在场,团队建设的时候在场,技术决策的时候在场,那叫真参与。他不爱说话,但说的每一句都在做事上。
你搜梁文锋的时候,最想知道的是什么。不用多问。答案就一个:他到底是个怎样的人。而那个答案,你搜不到。你得看DeepSeek发了什么论文,招了什么人,开源了什么模型。那些才是他的话。
搜梁文锋的时候,你最想知道的是什么?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.