网易首页 > 网易号 > 正文 申请入驻

突然爆火!浙大天才,震惊全球

0
分享至

作 者丨孔海丽

编 辑丨骆一帆,江佩佩

1月28日,多个与DeepSeek相关的话题,霸屏热搜!

近段时间,梁文锋和公司团队开发的大模型“DeepSeek-V3”,一再震撼硅谷和华尔街,被海外称为“来自东方的神秘力量”。

1月27日,DeepSeek登顶苹果中国地区和美国地区应用商店免费App下载排行榜,超越了ChatGPT。

这当然是不折不扣的奇迹。

对此,网友们也纷纷评论点赞:

DeepSeek创始人17岁考上浙大,36岁掌管千亿私募

据公开资料,DeepSeek创始人梁文锋,1985年出生于广东省湛江市。梁文锋从小成绩优异,小学六年级时他就通过考试被吴川一中录用。一直是学校里的“尖子生”并在数学学科表现出极大天赋。

最后一排右边第6个是梁文锋。图源:湛江青年

2002年,梁文锋17岁,以吴川一中“高考状元”的成绩考上浙大本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。

2013年,梁文锋与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。

2021年,幻方的资产管理规模突破千亿大关,2023年,他宣布将正式进军通用人工智能领域,并创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。

近日这名85后还现身《新闻联播》以AI初创公司深度求索(DeepSeek)创始人的身份参加了一场国家超高规格座谈会,并现场发言。

DeepSeek崛起,英伟达创纪录暴跌

当地时间1月27日,美股芯片板块大幅调整,英伟达暴跌16.86%,创市值最大蒸发纪录;博通大跌逾17%,甲骨文下跌近14%,纳斯达克下挫3.07%。

很多投资者将这次的调整归因于DeepSeek的崛起。这家位于杭州的人工智能公司,最近推出了最新开源大模型R1,其性能直追OpenAI大模型o1。

该公司去年12月推出的大模型DeepSeek-V3,多项测试性能直追Anthropic的Claude-3.5和OpenAI的闭源模型GPT-4o,个别项目甚至有所超越。

正当一批AI分析师认为DeepSeek只聚焦于语言大模型而暂时放弃多模态模型时,该公司于1月28日发布了一款多模态大模型Janus-Pro,而该模型在图像生成基准测试中超过了OpenAI的DALL-E3。

最令硅谷震惊的是,DeepSeek的开源大模型,性能卓越,却是在更低成本、更短时间、更少算力的基础上实现的。V3和R1的训练成本均只有550万美元左右,不及Anthropic和OpenAI同类模型成本的十分之一。

图源:DeepSeek官网

特朗普发声:DeepSeek为美国行业敲响警钟

美国总统特朗普当地时间27日在佛罗里达州迈阿密举行的共和党会议上表示,中国人工智能初创公司DeepSeek的崛起应当为美国企业敲响“警钟”,“这可能是非常积极的发展。因此,与其投入数十亿资金,不如花费更少的(资源),但愿能得出同样的解决方案。”

人工智能国际大佬又是如何看待这一奇迹?

微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在世界经济论坛上谈到DeepSeek时表示:“DeepSeek的新模型令人印象深刻,他们不仅有效地构建了一个开源模型,能够在推理计算时高效运行,而且在计算效率方面表现出色。我们必须非常非常认真地对待中国的AI进步。”

创立于2022年的Perplexity,估值90亿美元,是仅次于Anthropic和OpenAI等第一梯队的人工智能新创企业。近日,Perplexity首席执行官Aravind Srinivas(阿拉温德·斯里尼瓦斯)在一次访谈中详谈了对DeepSeek的看法。

斯里尼瓦斯表示,需求是发明之母。由于硬件资源条件受限,中国企业不得不寻找变通方案,最终,“他们(DeepSeek)以更高效、更低成本的方式开发了类似(Anthropic和OpenAI)的技术。这确实让人感到压力”。如果说Meta正在赶上OpenAI或Anthropic,那么同样的说法也可以用于中国赶上美国。

但是,为DeepSeek的成就感到兴奋自豪之余,也要对世界人工智能永不停歇的发展势头保持客观理性的认识,不可盲目自满。

21观察│重新认识DeepSeek奇迹

21世纪经济报道记者近期采访了多位国内专家和相关从业人员、投资者,关于DeepSeek现象,有以下共识:

其一,V3和R1的重大突破,并不能证明算力不重要。

近几年以OpenAI为代表的美国人工智能发展,是建立在更强的算力、更大的参数、更高的成本之上。某种程度上,它可称之为人工智能的“硅谷叙事”。这个粗放豪横的模式讲到极致,就是5000亿美元的星际之门计划。

但中国企业无法获得高性能的芯片,也没有那么多的资金。客观条件受限,只能在底层算力基础上进行架构、算法和数据利用方面的探索,在特定领域走出一条高效率、低成本的实用主义路子。

这条路子就是如浙江大学计算机博士、美国南加州大学访问学者傅聪所说的,在“后训练”过程中,通过学习CoT(思维链)的方式,一步一步推理得出结果,而不是直接预测答案,“这一方案,也是圈子内对OpenAI o1模型实现路径的猜测,而Deepseek用极快的速度,验证了这一路径的可行性!”

事实上,DeepSeek创始人梁文锋透露,此前该公司已储备了万张A100芯片等。这比一般初创公司强多了。只不过,在开发V3和R1时,由于效率高,他们没有使用那么多算力罢了。

其二,英伟达等芯片股的调整,主要是市场风险的释放,与DeepSeek的重大突破之间,逻辑上没有必然联系。

以英伟达为代表的人工智能板块,已持续上涨几年。中间虽然偶有波动,但调整并不充分。英伟达PE长期横移在40倍上方,17日收盘后仍有45倍。

1月17日纳斯达克芯片股的大跌,更多是在高估值风险预期之下一种市场情绪的释放。

DeepSeek只是提供或者触发了风险释放的媒介。现在没有证据表明,全球算力尤其是高端算力资源已经过剩。更大的可能是,如果2025年打开了人工智能应用的空间,算力需求也会随之增加,只不过,像DeepSeek这样高效率利用算力,将会被更多企业借鉴。AI硬件仍有很大的增长空间,算力叙事没有过时。

当地时间1月27日,英伟达发表声明表示,DeepSeek所取得的进展,显示出其芯片在中国市场的实用价值,且未来为满足DeepSeek的服务需求,将需要更多英伟达芯片。

其三,探索与追赶:中国企业的创新能力在增强。

梁文锋去年7月在接受媒体采访时说,硅谷习惯于将中国AI公司视为follow的角色,当一个中国公司以创新贡献者的身份,加入到他们游戏里去,而且表现优异时,他们就很震惊。

毫无疑问,在大模型开发路径上,DeepSeek扮演了一种创新者的角色,亦即低成本、少算力的高效集成之路。

作为追赶者,存在后发优势。1月26日,在拾象创始人兼CEO李广密组织的关于 DeepSeek的闭门讨论会上,专家提出,AI 类似阶跃函数,现在做追赶者的算力需求少了 10 倍。追赶者的算力成本一直不太高,但探索者还是要训很多模型。

后发者可以聪明地进行创新。举个例子。大模型开发需要庞大的数据集(数据库)。而数据有没有标注,其精确度是不一样的。前述专家透露,DeepSeek 非常重视数据标注,听说梁文锋自己也会打标签,这就大大提高了他们数据的精确度。再比如,DeepSeek还善于做数据蒸馏(优化筛选),当然如果是开发通用大模型就不能做数据蒸馏。这些都是‌该公司Post-training更高效率的体现。

DeepSeek给国内同行的其他启示还包括,大模型开发在降低成本的同时也可以探索智能的边界,在Transformer之外寻找其他架构;产品上,AI agent在未获得大规模应用之前,有很大的探索空间,存在多领域商用的机会,今年在多模态方面,可能会出现能挑战ChatGPT形态的产品。

硅谷一位华裔资深AI工程师对21世纪经济报道记者说,DeepSeek以低成本、高效率开发了几款了不起的产品,探索出了一条全新的路径,让国际同行也不得不佩服,但我们在自豪之余,也要客观认识到,DeepSeek等中国AI新创企业,目前还不具备全面挑战OpenAI、Anthropic这些巨头的实力。人工智能的竞争才刚刚开始,前面有无限可能

你有使用DeepSeek吗?欢迎评论说说看

部分内容来自湛江青年、钱江晚报

SFC

本期编辑 江佩佩

21君荐读

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股:今天收3889.08,尾盘已明确,做好准备,明天周五,要变盘了

A股:今天收3889.08,尾盘已明确,做好准备,明天周五,要变盘了

虎哥闲聊
2026-03-26 15:09:13
重庆警方通报“一小区有人高空撒钱”:系涉诈嫌犯抛撒赃款

重庆警方通报“一小区有人高空撒钱”:系涉诈嫌犯抛撒赃款

澎湃新闻
2026-03-26 21:39:03
女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

观威海
2026-03-26 10:39:05
伊朗发动第82波打击

伊朗发动第82波打击

闪电新闻
2026-03-26 18:32:07
五枚导弹,拦下四枚,就那漏网的一枚,不偏不倚,正好砸中…

五枚导弹,拦下四枚,就那漏网的一枚,不偏不倚,正好砸中…

福建平子
2026-03-25 10:14:49
别再说微胖的女生穿紧身牛仔裤显胖了!这身材谁看了不迷糊

别再说微胖的女生穿紧身牛仔裤显胖了!这身材谁看了不迷糊

牛弹琴123456
2026-03-22 13:59:13
官方:CCTV5、央视频等平台将转播国足vs库拉索

官方:CCTV5、央视频等平台将转播国足vs库拉索

懂球帝
2026-03-26 17:12:06
小凯文-波特:为了维护科比,我要打破阿德巴约的83分纪录

小凯文-波特:为了维护科比,我要打破阿德巴约的83分纪录

懂球帝
2026-03-26 18:48:05
稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

田先生篮球
2026-03-26 14:23:29
费率0.3%,社保“第六险”来了,退休人员也要交

费率0.3%,社保“第六险”来了,退休人员也要交

财话连篇
2026-03-26 13:09:33
“只要决心够大,诺贝尔奖不在话下!”

“只要决心够大,诺贝尔奖不在话下!”

槽逻辑
2026-03-24 18:46:27
9020mAh!新机官宣:3月26日,正式发布上市!

9020mAh!新机官宣:3月26日,正式发布上市!

科技堡垒
2026-03-26 11:29:06
马英九基金会决定中止今年两岸青年交流,马应该出面声明!

马英九基金会决定中止今年两岸青年交流,马应该出面声明!

达文西看世界
2026-03-26 10:58:22
我在小城市,一个人做电商,半年挣300万

我在小城市,一个人做电商,半年挣300万

南风窗
2026-03-26 10:07:51
好消息!麒麟芯片已不受制裁了,华为手机真正全面归来

好消息!麒麟芯片已不受制裁了,华为手机真正全面归来

互联网.乱侃秀
2026-03-26 10:55:17
突发!伊朗革命卫队“波斯湾之虎”被斩首,霍尔木兹海峡要变天?

突发!伊朗革命卫队“波斯湾之虎”被斩首,霍尔木兹海峡要变天?

老马拉车莫少装
2026-03-26 17:53:46
张雪峰的病,速效救心丸能救吗?

张雪峰的病,速效救心丸能救吗?

中国新闻周刊
2026-03-25 16:23:30
很多被奉为经典的古文,很难说有多少教育意义

很多被奉为经典的古文,很难说有多少教育意义

小院之观
2026-03-24 08:30:13
孙芸芸升级当外婆!孩子父亲晒大量合影,和廖思维和平分手没跑路

孙芸芸升级当外婆!孩子父亲晒大量合影,和廖思维和平分手没跑路

八斗小先生
2026-03-26 14:40:39
这才叫杀疯了!烂番茄100%动作神片,这不直接碾压《镖人》?

这才叫杀疯了!烂番茄100%动作神片,这不直接碾压《镖人》?

动物奇奇怪怪
2026-03-26 17:48:01
2026-03-26 22:35:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
239820文章数 743882关注度
往期回顾 全部

财经要闻

油价"驯服"特朗普?一到100美元就TACO

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
旅游
时尚
家居
本地

教育要闻

江苏省教育厅公布全省中小学生竞赛活动名单

旅游要闻

别再人挤人,泰州的这条老街,传承1200年!

上新|| 她们说,找到了自己的人生裙子!

家居要闻

傍海而居 静观蝴蝶海

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

无障碍浏览 进入关怀版