网易首页 > 网易号 > 正文 申请入驻

梁文锋的秘密武器:DeepSeek R2或5月问世,成本仅GPT-4o的2.7%?

0
分享至

五月将至,中美科技巨头或将迎来新一轮巅峰对决。

先是在4月中旬,OpenAI一口气发布了GPT-4.1 o3、o4 mini系列模型;谷歌则拿出了Gemini 2.5 Flash Preview,一个混合推理模型;与谷歌同一天,豆包在杭州巡展中正式发布了1.5·深度思考模型,在多模态上展现出了更强的实力。凤凰网科技从行业人士处了解到,阿里的下一代大模型Qwen3也将于本月内发布。

混战之下,那股“神秘的东方力量”似乎也在悄悄准备着新的发布。

敏感的神经之下,一点蛛丝马迹都会被放大。昨日,全球最大AI开源社区Hugging Face首席执行官Clément Delangue在社交平台发布了一条耐人寻味的动态。这条动态仅由三个眼睛的表情符号构成,并附上了DeepSeek团队在Hugging Face平台的官方资源库入口。


这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。

DeepSeek R2发布已进入倒计时?

近半个月来,有关“DeepSeek全新模型R2即将问世”的传闻持续发酵。除HuggingFace首席执行官Clément Delangue发布动态外,玩家@deedydas也在社交平台贴出了所谓DeepSeek-R2大模型的详细技术参数。


1、拥有 1.2万亿参数,活跃参数为 780亿,采用混合 MoE架构

2、成本比 GPT-4o便宜 97.3%(输入每百万次 0.07美元,输出每百万次 0.27美元)

3、使用了 5.2PB的训练数据,在 C-Eval2.0测试中取得了 89.7%的得分

4、视觉能力更强,在 COCO测试集上达到了 92.4%


凤凰网科技就以上消息向DeepSeek方面发去询问,对方表示不予回应。有接近DeepSeek的知情人士对凤凰网科技表示,目前网上盛传的消息,真实性含量非常低。

但结合DeepSeek的产品迭代规律与产业链动态,其五月有望发布新品的传闻却并非空穴来风。

据《中国企业家》报道,过去DeepSeek创始人梁文锋率领的AI团队始终保持着与国际巨头同频的产品迭代节奏——2024年9月推出V2.5版本,12月发布V3基础架构,次年3月即升级至V3-0324版本,形成每季度重大更新的开发范式。这种紧扣行业脉搏的研发策略,使得业界普遍预测其下一代主力模型R2或将延续“五一档”发布传统。

路透社此前披露的研发动向印证了这种猜测:DeepSeek正在加快R1模型的后续产品R2的研发和发布进程,原计划在5月初发布,但公司现在希望能够尽早推出 。

更值得关注的是技术演进方向,此前也有业内人士推测,DeepSeek-R2模型预计将在代码生成和除英语外的更多语种推理能力方面有不小的提升。

这一预期并非无中生有——今年三月发布的V3-0324版本已展现惊人实力,根据Artificial Analysis Intelligence Index最新评测,该模型已经成为得分最高的非推理模型。在基准测试中力压Google Gemini 2.0 Pro、Anthropic Claude 3.7Sonnet及Meta Llama 3.3 70B等顶尖模型。

这种技术积淀与迭代速度,使得R2尚未发布便已承载全球AI界的较高期待。无论前述传闻最终是否成真,可以预见的是,当这款新模型正式亮相时,或将改写新一轮全球算法与算力生态格局。该梁文锋出场了

在国产AI大模型赛道暗流涌动的当下,DeepSeek创始人梁文锋的每一步都走得很稳。他曾说过:“中国也要逐步成为创新贡献者,而不是一直搭便车。”

尽管近期DeepSeek在公众视野中保持低调,但梁文锋一直在向着DeepSeek的核心使命努力,那就是探索通用人工智能的本质。

多位接触过DeepSeek团队的人士都认为,梁文锋的志向不在服务好用户和做好产品,而是直指终极AGI。这让他在早年间试探性接触资方时,优先排除了有退出顾虑的绝大多数机构,甚至主要依托于自有资金,“梁文锋也有这个资本实力”。

一位在早期就接触过DeepSeek的机构对凤凰网科技表示,梁文峰很早就发现Chatbot产品的可替代性很强,“现在的产品都没有黏性,所以只要技术强随时可以把用户抢过来”。DeepSeek R1的发布也的确证实了这一观点。

DeepSeek的最后一次模型更新发布是在今年3月,发布了V3-0324版本,也被看作是R2的基础模型,已针对性能、用户体验和实用性进行了优化,通过6850亿参数的MoE架构升级,代码能力显著增强,又一次深度影响了全球市场。

因而5月或将发布的旗舰模型R2,也被视为影响全球AI格局的关键落子。

特别需要说明的是,这一技术攻坚的窗口期,恰逢国产芯片产业剧变。美国对英伟达H20芯片的出口禁令,直接斩断中国AI企业获取高端GPU的主渠道,倒逼华为昇腾910C、寒武纪MLUarch04等国产芯片加速填补市场空白。

清程极智的CEO汤雄超曾经告诉凤凰网科技,作为当前开源市场所能用到的最好模型,DeepSeek和最难获取的芯片一度是深度捆绑的。如此前DeepSeek开源周所呈现的,其推出了一系列针对英伟达H卡的算力优化方案。

这让梁文锋在早年间曾表达:“我们真正的挑战从来不是资金,而是高端芯片的出口禁令。”

但禁令也从未真正束缚其技术野心,“英伟达的GPU没有什么神秘之处,但要赶上他们,就必须重建团队、付出时间和成本,追赶下一代技术——这才是真正的护城河。”梁文锋表示。

多位国产算力产业从业人士也对凤凰网科技表示,当前国产生态已在加速迭代中。

本次DeepSeek新一代旗舰模型发布,也或将存在另一变量,即在推理侧深度适配国产算力。

当前,千行百业都展现出了旺盛的大模型部署需求,但正如李彦宏所言,DeepSeek最大的问题就是又慢又不稳定,如何才能获取到稳定的、便宜的满血版DeepSeek,这不仅仅是行业需要解决的问题,更需要DeepSeek官方加入其中。

值得一提的是,凤凰网科技从行业人士处了解到,DeepSeek已经正在和一些国产芯片合作,“国产芯片中有些头部的,实际上已经在和DeepSeek合作了”。

但对于合作的进展,以及R2可能满足的情况,目前尚不能得知更多细节。

本文源自:凤凰网科技

作者:姜凡

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
23年,59岁傅艺伟独子离世,账号2年未更新,儿子同学透露死因

23年,59岁傅艺伟独子离世,账号2年未更新,儿子同学透露死因

山河月明史
2025-09-05 13:14:38
福建九地市“辖区”之争,鼓楼险胜思明,蕉城第四,丰泽不敌新罗

福建九地市“辖区”之争,鼓楼险胜思明,蕉城第四,丰泽不敌新罗

东国青年
2025-09-14 00:30:08
腾讯又出“王炸”剧!才播12集全国收视率第一,演员演技惊艳四座

腾讯又出“王炸”剧!才播12集全国收视率第一,演员演技惊艳四座

娱影综说
2025-09-14 21:42:29
39岁江疏影巴塞罗那街头被偶遇 没有化妆 素颜状态超绝 本人很松弛

39岁江疏影巴塞罗那街头被偶遇 没有化妆 素颜状态超绝 本人很松弛

TVB的四小花
2025-09-12 13:21:37
被曝核酸造假,半年敛财4.5亿,核酸大王张核子最终下场如何?

被曝核酸造假,半年敛财4.5亿,核酸大王张核子最终下场如何?

天气观察站
2025-09-14 06:05:19
死刑执行及停止

死刑执行及停止

北京刑事律师赖建平
2025-09-14 05:00:05
孙俪晒9道干净饭,无辣少油还美味又健康,难怪邓超身体年龄27岁

孙俪晒9道干净饭,无辣少油还美味又健康,难怪邓超身体年龄27岁

黄大姐
2025-09-13 15:34:26
田径世锦赛爆大冷!奥运会冠军预赛出局,马拉松百米冲刺决出金牌

田径世锦赛爆大冷!奥运会冠军预赛出局,马拉松百米冲刺决出金牌

小偀说故事
2025-09-14 11:58:00
谁在掏空中国楼市?囤房1.3万亿!中国最大炒房团要清仓走人?

谁在掏空中国楼市?囤房1.3万亿!中国最大炒房团要清仓走人?

爱看剧的阿峰
2025-09-15 02:16:29
前TVB花旦苟芸慧宣布正式离婚:现在非常自由,希望进组拍戏

前TVB花旦苟芸慧宣布正式离婚:现在非常自由,希望进组拍戏

陌识
2025-09-14 18:55:15
日子过久了发现:破壁机才是“厨房神器”,看谁还在傻乎乎闲置!

日子过久了发现:破壁机才是“厨房神器”,看谁还在傻乎乎闲置!

装修秀
2025-09-14 11:00:04
青岛市委常委、黄岛区委书记孙永红接受纪律审查和监察调查

青岛市委常委、黄岛区委书记孙永红接受纪律审查和监察调查

极目新闻
2025-09-14 10:09:32
1只就判刑!2014年,四川男子开豪车进山,6小时杀5只

1只就判刑!2014年,四川男子开豪车进山,6小时杀5只

万象硬核本尊
2025-09-13 18:01:08
广东省学费最贵的5所大学,敢报考的学生,家里非富即贵!

广东省学费最贵的5所大学,敢报考的学生,家里非富即贵!

教育导向分享
2025-09-14 21:33:07
2025国庆放假通知:4个好消息、3个坏消息,这些细节你可别漏看了

2025国庆放假通知:4个好消息、3个坏消息,这些细节你可别漏看了

小彭聊社会
2025-09-14 02:49:20
邱毅观点惊人:倘若解放军踏上台湾土地,台军极可能直接缴械投降

邱毅观点惊人:倘若解放军踏上台湾土地,台军极可能直接缴械投降

大道无形我有型
2025-09-11 18:51:24
关之琳直言:如果当年刘銮雄没送我2套房子,我或许是刘德华妻

关之琳直言:如果当年刘銮雄没送我2套房子,我或许是刘德华妻

百态人间
2025-09-02 11:35:57
贾国龙表态:我应对方式有错,改;罗永浩是网络黑嘴,但他打醒了我

贾国龙表态:我应对方式有错,改;罗永浩是网络黑嘴,但他打醒了我

超角度
2025-09-14 20:49:06
人民日报亲自点名,阎维文真实处境暴露,李双江一个字都没说错

人民日报亲自点名,阎维文真实处境暴露,李双江一个字都没说错

山河月明史
2025-09-13 16:06:04
欧锦赛不败夺冠+世界杯双料冠军!德国过去三届洲际大赛21胜2负

欧锦赛不败夺冠+世界杯双料冠军!德国过去三届洲际大赛21胜2负

直播吧
2025-09-15 04:11:16
2025-09-15 05:43:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
7859102文章数 545468关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

罗永浩深夜发文:贾总 找个平台直播理性对一次话吧

头条要闻

罗永浩深夜发文:贾总 找个平台直播理性对一次话吧

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

旅游
艺术
数码
家居
军事航空

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

数码要闻

古尔曼:苹果首款智能眼镜产品无显示屏,预计12至16个月内推出

家居要闻

原木风格 温馨舒适氛围

军事要闻

俄无人机飞入波兰 美国务卿:不可接受

无障碍浏览 进入关怀版