网易首页 > 网易号 > 正文 申请入驻

DeepSeek上新,又一次“开源的巨大胜利”

0
分享至

2025.05.29

本文字数:961,阅读时长大约1.5分钟

作者 |第一财经 刘晓洁

5月28日晚,第一财经记者获悉,DeepSeek小助手在官方交流群中通知,DeepSeek R1模型已完成小版本试升级,紧接着就在29日凌晨,官方在开源平台HuggingFace上发布了DeepSeek-R1-0528。

目前官方还未更新模型卡以及公告介绍,但不少开发者已经第一时间进行了测试,发现这个“小版本升级”并不小,海外开发者感慨“一如既往的DeepSeek低调风格”。

众多测试发现,DeepSeek-R1-0528目前提升最为明显的是代码能力,在代码测试平台Live CodeBench中,其性能几乎媲美OpenAI重量级的o3-high模型。

有开发者表示,这是“开源的巨大胜利”。

不过,或许受限于测试的速率限制,目前开发者群体中公认编程能力最强的Claude-4系列模型并不在测试榜单中。

AI博主同时也是KCORES开源硬件项目联合创始人@karminski-牙医进行了个人的测试,基于最新的DeepSeek-R1模型和Claude-4-Sonnet进行测试,测试内容是用一个橙色小球撞击物体,从效果显示,平面的橙色漫反射、 撞击效果方面是R1模型更好。

但有开发者对第一财经表示,这类能力看个例是不准的,或许要等评测榜单和一个月后的口碑见分晓。

除了代码能力,有开发者总结了DeepSeek这次更新其他亮点,包括改进了写作任务,更自然、格式更好。也有用户反映,用最新模型写作正常很多,没有强烈的“量子力学元素”了。

@karminski-牙医同时对最新模型进行了文本召回测试,发现在上下文32K以内比之前的R1模型要好不少,但是在60K的上下文中效果下降了不少。这意味着在32K以内针对给定的材料使用新R1模型提问,回答的准确度会更好。

在RI这次“小版本试升级”后,有海外网友表示,如果这是R1,那么R2会有多好?DeepSeek官方针对此前的V3模型和R1模型都做了一次迭代,但仍未放出大家期待的R2模型的消息。

此前3月,DeepSeek也是在hugging face默默上新DeepSeek-V3-0324迭代版本模型,DeepSeek介绍,新版V3模型借鉴R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,此外在前端开发、中文写作等方面进行了能力优化。

有业内人士猜测,是否模型架构不更新,只是增加或调整了训练数据,DeepSeek就不将更新定义为大版本升级,而业内其他模型给出明显的版本号迭代则是一种品牌营销需求。目前DeepSeek并未对此进行任何解释。

除了上述模型能力,开发者也希望未来DeepSeek R2若进行升级能大幅提升上下文长度,以及增加多模态的能力,毕竟这两个方面的能力对于生产使用很重要。

微信编辑| 七三

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么氰化物入口几秒,还没到胃呢,人立马就会死了?

为什么氰化物入口几秒,还没到胃呢,人立马就会死了?

心中的麦田
2026-03-24 19:53:20
2019年,滴滴司机钟元被执行死刑,死前害怕不已,跪地不停忏悔

2019年,滴滴司机钟元被执行死刑,死前害怕不已,跪地不停忏悔

南宗历史
2026-03-17 01:08:53
为满足中国台湾地区F-16V订单需求,洛马公司开始实行两班倒生产

为满足中国台湾地区F-16V订单需求,洛马公司开始实行两班倒生产

零度Military
2026-03-25 18:51:44
“科大男生9秒视频”火了,生猛操作令人叹为观止:不愧是高才生

“科大男生9秒视频”火了,生猛操作令人叹为观止:不愧是高才生

妍妍教育日记
2026-03-20 21:33:36
全新塞纳实车曝光!2.4T混动+超250马力

全新塞纳实车曝光!2.4T混动+超250马力

沙雕小琳琳
2026-03-26 01:58:11
伊朗军方公布第26天作战行动细节 打击多处美以目标

伊朗军方公布第26天作战行动细节 打击多处美以目标

极目新闻
2026-03-26 14:33:54
北京今日傍晚北风渐起,周末有弱降水

北京今日傍晚北风渐起,周末有弱降水

北青网-北京青年报
2026-03-26 13:27:04
先被里瓦尔多全面逆袭,后遭齐达内强势碾压,全能战士时运不济

先被里瓦尔多全面逆袭,后遭齐达内强势碾压,全能战士时运不济

足篮大世界
2026-03-26 10:52:09
大崩盘!骑士最多落后高达21分:全队三分15中3,哈登心不在焉

大崩盘!骑士最多落后高达21分:全队三分15中3,哈登心不在焉

体坛小李
2026-03-26 08:53:49
国际援助船抵达哈瓦那声援古巴

国际援助船抵达哈瓦那声援古巴

新华社
2026-03-26 10:53:10
CBA再现蓄意伤人!白边遭恶汉暴力拉拽颈部,沪迷:阿日下手轻了

CBA再现蓄意伤人!白边遭恶汉暴力拉拽颈部,沪迷:阿日下手轻了

寻墨阁
2026-03-26 15:39:31
马云预言成真?2026年开始,房地产市场或会迎来4大转变?

马云预言成真?2026年开始,房地产市场或会迎来4大转变?

二大爷观世界
2026-03-26 13:49:44
清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

历史小破站
2026-03-19 04:05:03
男子买菜顺手买体彩!花4元中698万 先上班再领奖 现场捐2000元

男子买菜顺手买体彩!花4元中698万 先上班再领奖 现场捐2000元

念洲
2026-03-26 13:12:32
美众议院议长:美军在伊朗“不会进行地面作战”

美众议院议长:美军在伊朗“不会进行地面作战”

界面新闻
2026-03-25 23:23:00
杜富国的待遇有多高?再多优待,都配不上他的牺牲

杜富国的待遇有多高?再多优待,都配不上他的牺牲

安安说
2026-03-25 11:29:29
1958年周恩来突然提出辞去总理职务,毛主席听后只说了一句话,全场沉默

1958年周恩来突然提出辞去总理职务,毛主席听后只说了一句话,全场沉默

文史明鉴
2026-03-24 18:49:17
最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

小光侃娱乐
2026-03-26 06:55:03
意大利附加赛大决战先发:中场实力相对稳妥,锋线颓势令人忧

意大利附加赛大决战先发:中场实力相对稳妥,锋线颓势令人忧

里芃芃体育
2026-03-26 16:00:06
悲催!怎么会这么巧?张雪峰和曝光眼镜暴利的记者,都是心脏骤停

悲催!怎么会这么巧?张雪峰和曝光眼镜暴利的记者,都是心脏骤停

火山詩话
2026-03-24 18:23:32
2026-03-26 17:36:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
248239文章数 621904关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
亲子
本地
时尚
公开课

家居要闻

傍海而居 静观蝴蝶海

亲子要闻

妈妈是时尚小达人爸爸是朴素老模范!我要当爸爸的专属赞助人

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

皮衣+裙,高级到炸

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版