网易首页 > 网易号 > 正文 申请入驻

新版DeepSeek-R1深夜整大活!编程能力暴涨,实测直逼Claude 4,网友玩疯直呼太强了

0
分享至

智东西5月29日报道,今天凌晨,DeepSeek-R1-0528在Hugging Face上开源。

地址:
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

此前昨日晚间,DeepSeek官方推送通知,R1模型已经完成小版本试升级,可在官方网站、APP、小程序测试(打开深度思考)体验。

针对DeepSeek-R1-0528,DeepSeek尚未放出模型卡介绍更多功能。但多方用户体验后提到,DeepSeek-R1-0528在编程、逻辑推理、交互能力等方面均有显著提升。

已有开发者对DeepSeek-R1-0528进行了基准测试,称这是开源领域的重大胜利。代码测试平台Live CodeBench显示,其性能接近OpenAI在4月中旬发布的o4 mini和o3模型高版本

▲DeepSeek-R1-0528性能接近o3模型高版本

测试地址:
https://livecodebench.github.io/leaderboard.html

同时有文本召回测试结果显示,32k以内文本DeepSeek-R1-0528比之前的R1要好不少,但是60k下降了不少。这意味着在32k以内针对给定的材料使用新R1提问让它回答的话,准确度会好不少。

▲DeepSeek-R1-0528基于材料回复更准确

测试地址:
https://fiction.live/stories/Fiction-liveBench-May-22-2025/oQdzQvKHw8JyXbN87

多位开发者通过案例体验称,DeepSeek-R1-0528效果基本追平Claude 4,有些情况下表现更好。

“直接看效果, 我就提两点, 注意平面的橙色漫反射, 以及控制面板的美观程度。这俩是用同一个提示词一次性生成的,Claude 4 sonnet生成了542行, DeepSeek-R1-0528生成了728行。帧率和运动角度细节也值得关注。”一位开发者在X平台上称。


▲DeepSeek-R1-0528与Claude 4 sonnet进行效果比较

有开发者让DeepSeek-R1-0528、Claude 4和DeepSeek-V3-0324在飞机大战游戏生成对比效果。新版R1在之前的基础上,自己新增了很多道具,画面也比之前更好了。

▲开发者放出DeepSeek-R1-0528在飞机大战游戏程序的表现

此外,根据测试者反馈,DeepSeek-R1-0528能够一次性生成超千行无Bug代码,且在HTML/CSS/JS动态交互实现(如天气卡片动画、数据可视化)中更加精准。

DeepSeek-R1-0528在风格上更接近OpenAI o3,是目前开源大模型中性能顶尖的版本之一。有测试者认为,该版本的性能可能原本计划作为R2发布,但因竞争压力而以R1升级版形式推出。

来源:Hugging Face、X平台

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马刺后场球星:我们在全明星拿了很多第二,我们别再拿其他第二了

马刺后场球星:我们在全明星拿了很多第二,我们别再拿其他第二了

稻谷与小麦
2026-02-17 01:30:12
注意!春节不要乱发这种视频,有风险

注意!春节不要乱发这种视频,有风险

蓬勃新闻
2026-02-16 21:32:16
住建部已查清全国房子数量,过剩问题有多严重?楼市或迎来新变局

住建部已查清全国房子数量,过剩问题有多严重?楼市或迎来新变局

猫叔东山再起
2026-02-15 11:30:03
迪士尼法务部出手,字节跳动Seedance 2.0被指盗用漫威星战角色

迪士尼法务部出手,字节跳动Seedance 2.0被指盗用漫威星战角色

三言科技
2026-02-14 10:30:04
这真是刁民啊!大连一女子因违停被处罚,为发泄不满驾车撞向民警

这真是刁民啊!大连一女子因违停被处罚,为发泄不满驾车撞向民警

火山詩话
2026-02-15 16:25:00
马年春晚,不吹不黑客观评一评!

马年春晚,不吹不黑客观评一评!

阿废冷眼观察所
2026-02-17 01:20:23
李亚鹏突然提到十年前最难时给黄晓明发短信,不到一分钟收到回复

李亚鹏突然提到十年前最难时给黄晓明发短信,不到一分钟收到回复

百态人间
2026-02-10 15:25:10
中美俄卫星定位精度差距太大!美0.1米,俄1.5米,中国北斗是多少

中美俄卫星定位精度差距太大!美0.1米,俄1.5米,中国北斗是多少

来科点谱
2026-02-16 07:13:02
春晚收视出炉!郭富城王一博上场突破38.35%成最高点,引全场尖叫

春晚收视出炉!郭富城王一博上场突破38.35%成最高点,引全场尖叫

八卦南风
2026-02-16 23:15:30
13岁“敦煌少女”惊艳全网!妈妈回应:一毛钱没花,坚决不炒作

13岁“敦煌少女”惊艳全网!妈妈回应:一毛钱没花,坚决不炒作

观察鉴娱
2026-02-15 19:57:21
连续8年全国第一!中国最能生娃的省,根本不用催生

连续8年全国第一!中国最能生娃的省,根本不用催生

毒sir财经
2026-02-15 18:49:28
辞掉“铁饭碗”45天,张水华赚回一个“小目标”:这耳光,疼吗?

辞掉“铁饭碗”45天,张水华赚回一个“小目标”:这耳光,疼吗?

石辰搞笑日常
2026-02-16 21:31:48
数据帝:詹姆斯全明星赛打破57年纪录 33+8+3帽!文班复制乔丹壮举

数据帝:詹姆斯全明星赛打破57年纪录 33+8+3帽!文班复制乔丹壮举

宝哥精彩赛事
2026-02-16 16:26:23
除夕夜官宣:苹果春季发布会3月4日在中国上海举行!

除夕夜官宣:苹果春季发布会3月4日在中国上海举行!

PChome电脑之家
2026-02-16 22:30:43
中国收到以色列警告,称若协助伊朗发展核武器,将面临灾难性后果

中国收到以色列警告,称若协助伊朗发展核武器,将面临灾难性后果

纪中百大事
2026-02-16 11:29:14
伤得不轻,韦斯利-利马对抗时脚踝受伤,无法落地

伤得不轻,韦斯利-利马对抗时脚踝受伤,无法落地

懂球帝
2026-02-16 07:36:06
正月初一能洗头吗?新的一年想顺顺利利,牢记10个忌讳不要犯

正月初一能洗头吗?新的一年想顺顺利利,牢记10个忌讳不要犯

智慧生活笔记
2026-02-16 22:31:06
中戏风波持续发酵!王鑫在职期间3人免试入编,易烊千玺饱受质疑

中戏风波持续发酵!王鑫在职期间3人免试入编,易烊千玺饱受质疑

法老不说教
2026-02-15 23:24:29
尿毒症患者透析8年,称三年前在医院科室被借款15万元至今未还,许昌中医院通报:不存在对外承包科室的情形

尿毒症患者透析8年,称三年前在医院科室被借款15万元至今未还,许昌中医院通报:不存在对外承包科室的情形

大风新闻
2026-02-16 14:22:03
2026大年初一拜年50条体面又走心的祝福语

2026大年初一拜年50条体面又走心的祝福语

小陆搞笑日常
2026-02-16 23:47:37
2026-02-17 02:12:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11238文章数 116972关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

全明星正赛美国星辰队夺冠 爱德华兹MVP

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

教育
房产
手机
健康
军事航空

教育要闻

2025智慧家长家教好故事分享会大年初一19:32开播!

房产要闻

三亚新机场,又传出新消息!

手机要闻

华为Mate 80系列首登春晚竖屏直播,独家机位捕捉舞台侧精彩互动

转头就晕的耳石症,能开车上班吗?

军事要闻

慕安会美国角色逆转 中国议题"打满全场"

无障碍浏览 进入关怀版