网易首页 > 网易号 > 正文 申请入驻

DeepSeek的发布规律很简单,就是每逢佳节必发布

0
分享至

最近有不少人在说DeepSeek可能会在二月发布新版本。

这个其实都不用猜,甚至是大概率事件,因为DeepSeek发布新东西有一个特点,就是喜欢在节假日前。

最近的案例就是这篇mHC的论文,在2025年12月31日的国内时间晚上10:16。

都能想到按下发布键的那个研究人员的喜悦。


我觉得这可能是DeepSeek的一个习惯,就是喜欢在节假日前发东西,因为自己本身是开源公司且基本上不靠模型什么的赚钱,所以节前发了节后再看,管它那么多。

这是我做的一个简要的图,列举了DeepSeek过去一年比较重要的发布,你看R1在春节前8天,V3更新在清明节前,R1跟心在端午节前,V3.1倒是离得远,不过V3.2这个大更新,距离国庆节只有2天。


所以按照规律来推算,今年的春节deepseek也大概率会有一个新的发布,但是至于说是V4还是什么型号很难说,因为没人知道,DeepSeek算是最神秘的公司了。

其原因倒也简单,就是公司的主营业务是量化金融,赚钱比AI快还稳,这种纯粹拿AI当兴趣的公司行事举动和别的all in AI的差别很大。

再加上还有一条猜测的凭证,就是前两天DeepSeek发的那篇论文mHC倒是隐约的提到了类似的点,

此外,我们希望 mHC 能重新激发社区对宏观架构设计的兴趣。 通过加深对拓扑结构如何影响优化和表征学习的理解,mHC 将有助于解决当前的局限性,并有可能为下一代基础架构的演进开辟新的路径。

能从这个结论看得出来DS对于这个工作是很看重的,他们的taste感觉这个方向可能会成为下一代基础架构的引子。

但是他们也说了doubly stochastic matrices,就是mHC这篇文章用到的算法,效果很不错,但实际上类似的算法还有,这是一个open area,mHC起到的就是抛砖引玉的作用。

除非,DS真的是天选之子,上来就选中了最合适的流形约束算法。

否则,试错工作是需要全世界的科研工作者来做的。

而这种探索性质的工作,理论上不太会直接应用到自己对外的大模型中,特别是这种大版本更新,用一个正在探索中的算法或者框架,风险太高,且从论文的效果来看,并没有比原先的传统框架提高很多。

但是不是V4这就很tricky了,因为V3到R1,接下来的模型大家都觉得是R2或者V4,但结果是V3.1,V3.2,并没有想象中的大版本更新。

技术进步哪有那么快?

当然了,v3.2当成v4来发也没有人会说什么。

但是按照DS的性格,大概率只有大活才会换大版本号。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宣布独立,成立一个新的:高都丽共和国!

宣布独立,成立一个新的:高都丽共和国!

百态人间
2026-01-13 16:35:22
“刨猪汤”瞬间刹停,“呆呆”妹无比明智

“刨猪汤”瞬间刹停,“呆呆”妹无比明智

不主流讲话
2026-01-13 11:09:37
1984年贺子珍在上海病逝,市委不敢定丧葬规格,邓小平看后只说了一句话,结局出人意料

1984年贺子珍在上海病逝,市委不敢定丧葬规格,邓小平看后只说了一句话,结局出人意料

历史回忆室
2026-01-11 22:43:10
太厉害了!快去用中医诊断航空发动机吧

太厉害了!快去用中医诊断航空发动机吧

走读新生
2026-01-12 11:00:04
大V建议没钱取暖的河北农村老人可以到海南云南两广旅居过冬

大V建议没钱取暖的河北农村老人可以到海南云南两广旅居过冬

西虹市闲话
2026-01-13 13:46:51
丢联赛第一!上海爆冷遭深圳终结9连胜 张镇麟仅5分史密斯38+7

丢联赛第一!上海爆冷遭深圳终结9连胜 张镇麟仅5分史密斯38+7

醉卧浮生
2026-01-13 21:38:53
离婚才3个月,高调谈论再婚的李亚鹏,没给海哈金喜留一丝体面

离婚才3个月,高调谈论再婚的李亚鹏,没给海哈金喜留一丝体面

查尔菲的笔记
2026-01-13 13:13:56
俄乌战争,击碎了多少“神一样的存在”

俄乌战争,击碎了多少“神一样的存在”

望岳
2026-01-12 20:36:38
U23亚洲杯一夜2队出线!8强已定5席 韩国输球仍晋级 伊朗垫底回家

U23亚洲杯一夜2队出线!8强已定5席 韩国输球仍晋级 伊朗垫底回家

侃球熊弟
2026-01-13 21:36:50
孝感市委原书记潘启胜傍上蒋超良细节:一系列大项目都交给蒋超良五弟

孝感市委原书记潘启胜傍上蒋超良细节:一系列大项目都交给蒋超良五弟

澎湃新闻
2026-01-13 21:50:26
呆呆赢麻了!直播收入惊人,榜一大哥上门邀约,相亲对象后悔莫及

呆呆赢麻了!直播收入惊人,榜一大哥上门邀约,相亲对象后悔莫及

李健政观察
2026-01-13 18:12:45
蒋超良被渗透式“围猎” 商人开口就要大项目

蒋超良被渗透式“围猎” 商人开口就要大项目

环球网资讯
2026-01-13 20:53:20
圆桌|战略自主与强权约束之困:马杜罗事件为何成拉美“分水岭”时刻

圆桌|战略自主与强权约束之困:马杜罗事件为何成拉美“分水岭”时刻

澎湃新闻
2026-01-14 07:22:28
外交部:中方希望并支持伊朗保持国家稳定,我们一贯反对干涉别国内政

外交部:中方希望并支持伊朗保持国家稳定,我们一贯反对干涉别国内政

环球网资讯
2026-01-13 15:17:38
新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

医护健康科普
2025-08-31 17:07:58
2-3爆冷!9-0惨案!疯狂一夜,罗马出局,马赛狂胜,曼城掀翻纽卡

2-3爆冷!9-0惨案!疯狂一夜,罗马出局,马赛狂胜,曼城掀翻纽卡

足球狗说
2026-01-14 06:40:08
“为用优惠券,90元物品分两次结算遭嘲讽”?女子称在“零食有鸣”购物被锁店内;多方回应

“为用优惠券,90元物品分两次结算遭嘲讽”?女子称在“零食有鸣”购物被锁店内;多方回应

大风新闻
2026-01-13 18:13:32
浙大美女张燕飞去德国学汉学,回中国当博导……

浙大美女张燕飞去德国学汉学,回中国当博导……

吃瓜体
2026-01-13 17:05:24
男子发现妻子与他人不雅聊天记录,将记录发到妻子亲友群,并放任妻子服毒身亡,以故意杀人罪判处13年6个月

男子发现妻子与他人不雅聊天记录,将记录发到妻子亲友群,并放任妻子服毒身亡,以故意杀人罪判处13年6个月

观威海
2026-01-13 09:42:03
马斯克:现在学医毫无意义,钱很快消失,将发射8000颗太阳能卫星

马斯克:现在学医毫无意义,钱很快消失,将发射8000颗太阳能卫星

影像温度
2026-01-13 09:12:41
2026-01-14 09:11:00
平凡AI incentive-icons
平凡AI
高校AI从业者
63文章数 24关注度
往期回顾 全部

科技要闻

美国放宽对英伟达H200芯片出口中国的管制

头条要闻

加拿大总理访问中国 在华加拿大商界感到非常兴奋

头条要闻

加拿大总理访问中国 在华加拿大商界感到非常兴奋

体育要闻

他带出国乒世界冠军,退休后为爱徒返场

娱乐要闻

蔡卓妍承认新恋情,与男友林俊贤感情稳定

财经要闻

特朗普抨击鲍威尔:"那个混蛋"很快走人

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

亲子
房产
数码
手机
公开课

亲子要闻

3岁半女孩学习跳舞,小小年纪为了收腹用尽力气 #睡个好觉

房产要闻

又一新校开建!海口这一片区,迎来教育重磅升级!

数码要闻

macOS 26窗口为何拖不动?

手机要闻

苹果推送iOS / iPadOS / macOS 26.3第二个公测版

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版