网易首页 > 网易号 > 正文 申请入驻

DeepSeek扭转AI战局?谁说我们不能在“1到100”阶段异军突起

0
分享至

DeepSeek在蛇年新春给全球科技圈带来的冲击波,丝毫不亚于两年前ChatGPT横空出世带来的震撼。

而这一次,“冲击波”来自中国。

1月20日,DeepSeek发布了性能对标OpenAI-o1正式版的新模型——DeepSeek-R1,仅用1周,Deepseek应用就同时登顶苹果中国地区和美国地区应用商店免费App下载排行榜。除夕夜,它又发布了多模态大模型Janus-Pro,成为其一个月内发布的第三款大模型。

有意思的是,DeepSeek成立至今只有1年多,仍算是一家创业型公司。这股称为“来自东方的神秘力量”何以震动全球科创圈?多位专家认为,它最大的价值在于以极低的训练成本实现了可媲美甚至超越全球顶尖大模型的性能,而在此基础上的模式之变、开源之变,都将为人工智能的发展带来积极的意义。

“击穿”关键变量,打破算力神话

如果只用一个关键词来形容DeepSeek给全球科技圈带来的冲击力,多位专家都给出了一个词——成本。事实上,ChatGPT自问世以来,围绕它最大的争议在于居高不下的成本,由巨量芯片堆叠以及巨大电力消耗换来的大算力,是否真的能支持大模型长远发展?

Deepseek在成本这一关键变量上给出了“暴击”。据了解,DeepSeek-R1模型训练成本仅为560万美元,远低于美国开放人工智能研究中心、谷歌等科技巨头的技术投入成本。有人做了个比喻:如果把研发大模型比作烧开水,把对算力的投资比作烧水用的燃料,那么OpenAI烧开一壶水用了一车煤,谷歌用了一车98号汽油,马斯克用了一车航空煤油,发现壶里的水才冒泡,而创业型公司DeepSeek点燃几根火柴,就烧开了一壶水。

成本的骤降,往往会引发整个商业逻辑的变化:算力固然重要,但如果一款大模型可以花更少的钱,得出同样的解决方案,那么依靠重度氪金“外挂装备”成就大算力的逻辑就被打破了。事实上,美股市场已经给出了“投票”:除夕前一个美股交易日,包括英伟达、谷歌、微软3家公司一夜蒸发了7625亿美元的市值,约合5.5万亿人民币。虽然美股涨跌与DeepSeek不能完全划上等号,但市场的摇摆已经相当明显。

美银证券分析师Justin Post在报告中就认为,成本的降低将大大加速大模型的商业应用:“如果模型训练成本被证明可以显著降低,我们预计使用云人工智能服务的广告、旅游和其他消费应用的公司将在短期内获得成本效益。”

重构AI叙事,闯出特色本土模式

如果把成本作为透视大模型发展的一个基点,往上看,成本骤减将对未来的商业模式带来深远影响;而往下看,它更重要的意义在于蹚出一条大模型的本土发展模式。

此前,有网友尝试让DeepSeek写一篇“玄武门之变后李世民内心独白戏”,在思考8秒之后,DeepSeek写下的700多字刷屏朋友圈。它的惊艳之处在于,一方面具备对历史背景的深度把握,另一方面在文字对仗、渲染等文学上的造诣极深。而如果你用过 DeepSeek还会发现,它在给出回答之前,还给出了思考的过程——这与ChatGPT直接给出结果的底层逻辑完全不同。

浙江大学计算机博士傅聪解读认为,DeepSeek-R1的模型使用强化学习技术进行“后训练”,让模型的推理能力得到了极大的提升。简单地说,就是通过学习CoT(思维链)的方式,一步一步推理得出结果,而不是直接预测答案。而Deepseek用极快的速度,验证了这一路径的可行性。

除了新训练方法,DeepSeek还有不少变化,比如开源、深度联网等。目前R1是少数支持联网的推理模型,不少用户认为,其在大语言模型(LLM)上更卓越的表现,大概率与其支持联网搜索有关。而DeepSeek的完全开源策略,促进了AI开发者社区的协作生态,硅谷顶级风投a16z创始人马克·安德森(Marc Andreeseen)对此评论认为,DeepSeek的开源“是给世界的一份意义深远的礼物”。

数字产业分析师郝智伟认为,DeepSeek“低成本+新训练方法+开源+联网”的新模式,从某种程度上重构了AI大模型的叙事语言,走出了与海外不同的实用主义道路,也让用户与高阶AI对话的门槛大大降低,加快国产大模型的普及速度。

弯道超车,对中国科创圈启示几何

前谷歌首席执行官埃里克·施密特(Eric Schmidt)周二在一篇专栏文章表示,DeepSeek的崛起标志着全球人工智能竞赛的“转折点”。或许,DeepSeek的“蝴蝶效应”才刚刚开始,但它对中国科创圈的意义更加重大。

回到DeepSeek的诞生背景,这是一家中国创业型企业,尽管其拥有上万张中高端算力卡的较好条件,但与中国绝大多数的科技企业一样,存在高性能芯片不足、资金条件有限的客观局限性,这意味着,通过堆叠高端硬件“大力出奇迹”的方式走不通,必须在有限算力的基础上进行架构、算法、数据利用等内功的探索创新。DeepSeek的成功有其独特性,但它也同时证明了一件事:高效率低成本的本土模式是能走通的,为2025年国内大模型的发展开了个好头。

郝智伟认为,这一趋势在2024年已经有所体现,特别是大模型深度用户和创业者明显感觉到,国内的大模型更懂他们这个群体,无论是文生文的豆包、Kimi,图生视频的即梦、可灵,还是声音生成的海螺AI,这些国产AI系统都有不俗的表现。他认为,中国在“从0到1”的破局上,或许错过了大模型最初的爆发红利,但并不代表不能在“从1到100”的阶段异军突起,大模型的比拼注定是一场马拉松。

正如DeepSeek创始人梁文锋此前接受媒体采访时所说:“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现。但在这一波浪潮里,我们的出发点是走到技术的前沿,去推动整个生态发展。”

就在除夕夜,Deepseek再度发布了多模态大模型Janus-Pro,以“四两拨千斤”的模式,在文生图领域扮演了一条搅动全球科技圈的鲶鱼。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山东女子造出“天眼导弹”,突破中国导弹50年难关,坐拥26项专利

山东女子造出“天眼导弹”,突破中国导弹50年难关,坐拥26项专利

策略述
2026-03-26 13:44:30
300元抢红薯叶,国内仅2元一斤!美国高校:抑制96%肺部异变

300元抢红薯叶,国内仅2元一斤!美国高校:抑制96%肺部异变

果壳
2026-03-26 09:29:42
中国军事专家送日本3句话,太绝了,真不是吓唬他们

中国军事专家送日本3句话,太绝了,真不是吓唬他们

安安说
2026-03-26 11:21:19
沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

素衣读史
2026-03-25 21:26:46
连蔡依林都在玩,“雪山救狐狸”到底是什么梗?对话视频原创作者:最初只是为了卖酱板鸭,特意设置反转剧情,没想到会这么火

连蔡依林都在玩,“雪山救狐狸”到底是什么梗?对话视频原创作者:最初只是为了卖酱板鸭,特意设置反转剧情,没想到会这么火

极目新闻
2026-03-25 19:37:57
中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

澎湃新闻
2026-03-25 19:52:29
毛新宇参观祖宅时突然发现家谱记载:原来毛主席是毛太华第20代孙

毛新宇参观祖宅时突然发现家谱记载:原来毛主席是毛太华第20代孙

老杉说历史
2026-03-14 20:54:20
14.99万!“史上最便宜”特斯拉来了

14.99万!“史上最便宜”特斯拉来了

首席品牌观察
2026-03-24 16:18:39
Manus两名高管禁止离境? 外交部回应

Manus两名高管禁止离境? 外交部回应

每日经济新闻
2026-03-26 16:36:02
糖尿病能喝酒吗?医生提醒:喝酒时注意这个病,要喝就要这样喝

糖尿病能喝酒吗?医生提醒:喝酒时注意这个病,要喝就要这样喝

快乐的小大夫
2024-08-22 10:26:01
强闯中国驻日使馆不法之徒照片曝光,3月15日刚晋升三等陆尉

强闯中国驻日使馆不法之徒照片曝光,3月15日刚晋升三等陆尉

澎湃新闻
2026-03-26 14:34:04
三分命中率64.1%,断层全联盟第一!郭士强该给他一个国家队名额

三分命中率64.1%,断层全联盟第一!郭士强该给他一个国家队名额

弄月公子
2026-03-26 11:03:13
越扒越有!张雪峰去世早有预兆,他的3个不良爱好,或成催命符

越扒越有!张雪峰去世早有预兆,他的3个不良爱好,或成催命符

潮鹿逐梦
2026-03-26 11:24:44
太可恨!飞机一落地上海,女孩立马报案!更多年轻受害人浮出水面……

太可恨!飞机一落地上海,女孩立马报案!更多年轻受害人浮出水面……

环球网资讯
2026-03-26 21:48:04
吵翻热搜!罗永浩邀杨笠上播客被骂,愤怒回怼全网网友

吵翻热搜!罗永浩邀杨笠上播客被骂,愤怒回怼全网网友

雷科技
2026-03-26 14:27:37
《火遮眼》北美定档,近10年最强动作片,没人能挡住谢苗成为巨星

《火遮眼》北美定档,近10年最强动作片,没人能挡住谢苗成为巨星

阿纂看事
2026-03-26 16:03:34
汪小菲马筱梅基因太绝!家中“小炸毛”萌翻全网这颜值太招人疼!

汪小菲马筱梅基因太绝!家中“小炸毛”萌翻全网这颜值太招人疼!

孤酒老巷QA
2026-03-24 05:34:17
等不来特朗普,普京抢先一步来华!美国终于认栽:拦不住中国了

等不来特朗普,普京抢先一步来华!美国终于认栽:拦不住中国了

共工之锚
2026-03-27 01:04:00
新消息!伊朗突然宣布了!

新消息!伊朗突然宣布了!

达文西看世界
2026-03-23 20:29:16
日均接诊1.5万人次、手术500台,广东这家华南医疗航母火遍全省

日均接诊1.5万人次、手术500台,广东这家华南医疗航母火遍全省

健身狂人
2026-03-27 00:11:10
2026-03-27 03:24:49
文汇报 incentive-icons
文汇报
华语世界高品质人文阅读平台
273672文章数 309986关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
手机
旅游
艺术
公开课

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版