网易首页 > 网易号 > 正文 申请入驻

超越ChatGPT登顶 Deepseek被“挤”到宕机!或将推动AI应用爆发

0
分享至

《科创板日报》1月27日讯(记者 黄心怡)“正如大家没法猜到,做游戏显卡的英伟达,最后会成为AI界最重要的公司。大家也没法猜到,中国AI大模型的希望,可能就在炒股的公司身上。”一名金融科技业内人士表示。

今日,国内AI初创公司DeepSeek出现了短时闪崩现象。据DeepSeek回应,其服务再次“宕机”,源自新模型发布后,用户访问量激增所致。

这家由知名私募巨头幻方量化于2023年4月创立的大模型公司,近日正式发布推理大模型DeepSeek-R1。在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

“DeepSeek AI已经能思考了,这是质的飞跃。以前的模型在思考/推理方面不够稳定可靠,武汉大学计算机学院教授、中国人工智能学会心智计算专委会副主任委员蔡恒进如此评价DeepSeek。

在DeepSeek引发业内震动的同时,以科技股为主的纳斯达克100指数期货跌幅达3%,原因是市场担忧DeepSeek的AI模型可能会扰乱科技行业。

市场分析认为,DeepSeek R1的成功可能削弱了市场对英伟达AI芯片需求的预期。因为DeepSeek似乎以极低的成本构建了一个突破性的人工智能模型,并且无需使用顶尖芯片。这令人质疑对AI芯片投入数千亿美元支出的实际效用。

此前有消息称,DeepSeek仅用2048颗英伟达H800 GPU和约550万美元,就训练出6710亿参数的开源大模型,是Llama-3405B超6000万美元训练成本的十分之一不到。

不过,《科创板日报》记者了解到,550万美金只是DeepSeek-V3训练成本的一部分。根据DeepSeek的论文表述,这仅仅包括DeepSeek-V3的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本。而DeepSeek r1的真实算力成本投入远不止600万美元

多名业内人士认为,OpenAI对大模型的前沿探索与DeepSeek的后发追赶,所需的算力原本就不是一个量级。创新和探索必然伴随着算力和各项成本的浪费,在确定性的路径上优化所付出的代价,与探索未知所付出的代价之间不宜简单对比。

但是,DeepSeek大模型的推出,无疑展示了模型架构在算法和数据层面创新的价值。

曾几何时,OpenAI的火爆来自“大力出奇迹”,即算力越大、数据越多,就能得到越强的大模型。这种“军备竞赛”型开发模式,带来了惊人的能源消耗和训练成本。受大模型训练的高昂成本拖累,OpenAI在2024年的亏损额可能达到50亿美元,预计到2026年其亏损将进一步攀升至140亿美元。

“DeepSeek则带来了对算力/能耗的需求十余倍的降低。”蔡恒进强调。

魔形智能创始人徐凌杰向《科创板日报》介绍,DeepSeek巧妙利用了多种优化手段来降低成本,其中包括采用低精度数据格式进行训练,复用和共享参数,以及通过MoE混合专家的架构动态激活部分参数

除了降低AI大模型的硬件门槛和能源消耗,DeepSeek的成功,更重要的是为AI未来的应用落地铺平了道路。

随着模型性能的逐步稳定和应用的陆续落地,未来算力的推理需求将超过训练需求。Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll在接受《科创板日报》采访时就曾表示,接下来将看到更多关于AI推理领域的更多突破,即AI的实际应用。“这些创新将从数据中心延伸到边缘计算,再进一步扩展至终端设备。因此,下一轮创新的重点将从AI训练转向AI推理。这意味着在AI推理领域将迎来巨大的机遇。”

“历史数据表明,10倍成本下降可激发百倍需求,当前模型推理成本已进入快速下降通道,或将推动AI应用爆发。”徐凌杰表示,“针对-V3模型(参数量6710亿),其推理采用创新两阶段架构:32张H800 GPU并行处理预填充任务,320张H800集群加速流式解码。为追求极致性价比,需将数百GPU通过超高速网络组成‘超节点’,这一需求正推动智算中心集群化的演进,加速AI算力基础设施升级。”

目前,DeepSeek模型的端侧落地已在推进中。近日,AMD宣布将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型经过SGLang强化,针对Al推理进行了优化。而英特尔中国区技术部总经理高宇也表示:Deepseek-R1已经在AI PC上跑起来了!Flowy大模型AI PC应用平台现已支持在Intel Core Ultra AI PC上运行Deepseek-r。

端侧大模型正开始在智能手机、智能汽车、PC等多种设备上崭露头角。然而,硬件资源限制、模型压缩等多重挑战始终困扰着端侧大模型。Deepseek r1端侧大模型的推出,有望为下游应用的繁荣带来了更大的空间,推动更多推理芯片的涌现,以及大模型应用生态的发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人狂自有天收

人狂自有天收

李老逵乱摆龙门阵
2025-09-11 09:01:28
家电三巨头差距断崖:美的净利润385亿,海尔187亿,格力令人意外

家电三巨头差距断崖:美的净利润385亿,海尔187亿,格力令人意外

有范又有料
2026-03-24 10:59:07
20人老头乐公司起诉小米汽车,把网友们CPU干冒烟了……

20人老头乐公司起诉小米汽车,把网友们CPU干冒烟了……

柴狗夫斯基
2026-03-26 11:44:33
一名重大经济犯罪嫌疑人被押解回国

一名重大经济犯罪嫌疑人被押解回国

新华社
2026-03-26 15:00:03
70万韩国青年,选择“消失”

70万韩国青年,选择“消失”

中国新闻周刊
2026-03-26 09:30:07
iPhone4回收价暴涨80倍?借着二手手机涨价热点的又一波疯狂收割

iPhone4回收价暴涨80倍?借着二手手机涨价热点的又一波疯狂收割

柴狗夫斯基
2026-03-26 21:15:05
9.9元战火未熄,库迪用“不限量”掀了桌子!给瑞幸整不会了

9.9元战火未熄,库迪用“不限量”掀了桌子!给瑞幸整不会了

品牌观察官
2026-03-26 17:17:59
西安某建筑公司全方位崩塌!

西安某建筑公司全方位崩塌!

黯泉
2026-03-26 18:49:04
“鸡蛋界的LV”,安全了吗

“鸡蛋界的LV”,安全了吗

中国新闻周刊
2026-03-26 13:01:31
追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

喜欢历史的阿繁
2026-03-26 14:40:54
26号收评:沪指失守3900点,所有人都注意了,大盘后市开始这样看

26号收评:沪指失守3900点,所有人都注意了,大盘后市开始这样看

春江财富
2026-03-26 15:26:22
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

带你感受人间冷暖
2026-02-07 03:58:56
日媒:日本高中生起诉市政府和日本政府,指控市政府擅自将个人信息提交给防卫省用于招募

日媒:日本高中生起诉市政府和日本政府,指控市政府擅自将个人信息提交给防卫省用于招募

环球网资讯
2026-03-26 20:44:05
“中园石化”被立案调查

“中园石化”被立案调查

每日经济新闻
2026-03-25 11:13:18
狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

青眼财经
2026-03-17 16:03:09
2022年,江苏一老师路边花30元买1条上交,专家:很多年没见过了

2022年,江苏一老师路边花30元买1条上交,专家:很多年没见过了

万象硬核本尊
2026-03-26 22:23:37
上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

黄河新闻网吕梁
2026-03-26 15:14:06
“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

火山詩话
2026-03-26 11:11:22
保姆偷拿我两瓶茅台,我辞退未揭穿,临走她指我旧鞋,剪开后我懵了...

保姆偷拿我两瓶茅台,我辞退未揭穿,临走她指我旧鞋,剪开后我懵了...

感觉会火
2026-03-26 12:06:22
快提醒家里长辈:广州老年人优待卡满两年记得续期!手机就能办

快提醒家里长辈:广州老年人优待卡满两年记得续期!手机就能办

城事特搜
2026-03-26 19:13:51
2026-03-27 00:48:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
700137文章数 1019205关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
数码
教育
公开课
军事航空

艺术要闻

都说乌克兰美女多,看完摄影师贝格玛 的作品我信了!

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版