网易首页 > 网易号 > 正文 申请入驻

新版DeepSeek-R1深夜整大活!编程能力暴涨,实测直逼Claude 4,网友玩疯直呼太强了

0
分享至

智东西5月29日报道,今天凌晨,DeepSeek-R1-0528在Hugging Face上开源。

地址:
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

此前昨日晚间,DeepSeek官方推送通知,R1模型已经完成小版本试升级,可在官方网站、APP、小程序测试(打开深度思考)体验。

针对DeepSeek-R1-0528,DeepSeek尚未放出模型卡介绍更多功能。但多方用户体验后提到,DeepSeek-R1-0528在编程、逻辑推理、交互能力等方面均有显著提升。

已有开发者对DeepSeek-R1-0528进行了基准测试,称这是开源领域的重大胜利。代码测试平台Live CodeBench显示,其性能接近OpenAI在4月中旬发布的o4 mini和o3模型高版本

▲DeepSeek-R1-0528性能接近o3模型高版本

测试地址:
https://livecodebench.github.io/leaderboard.html

同时有文本召回测试结果显示,32k以内文本DeepSeek-R1-0528比之前的R1要好不少,但是60k下降了不少。这意味着在32k以内针对给定的材料使用新R1提问让它回答的话,准确度会好不少。

▲DeepSeek-R1-0528基于材料回复更准确

测试地址:
https://fiction.live/stories/Fiction-liveBench-May-22-2025/oQdzQvKHw8JyXbN87

多位开发者通过案例体验称,DeepSeek-R1-0528效果基本追平Claude 4,有些情况下表现更好。

“直接看效果, 我就提两点, 注意平面的橙色漫反射, 以及控制面板的美观程度。这俩是用同一个提示词一次性生成的,Claude 4 sonnet生成了542行, DeepSeek-R1-0528生成了728行。帧率和运动角度细节也值得关注。”一位开发者在X平台上称。


▲DeepSeek-R1-0528与Claude 4 sonnet进行效果比较

有开发者让DeepSeek-R1-0528、Claude 4和DeepSeek-V3-0324在飞机大战游戏生成对比效果。新版R1在之前的基础上,自己新增了很多道具,画面也比之前更好了。

▲开发者放出DeepSeek-R1-0528在飞机大战游戏程序的表现

此外,根据测试者反馈,DeepSeek-R1-0528能够一次性生成超千行无Bug代码,且在HTML/CSS/JS动态交互实现(如天气卡片动画、数据可视化)中更加精准。

DeepSeek-R1-0528在风格上更接近OpenAI o3,是目前开源大模型中性能顶尖的版本之一。有测试者认为,该版本的性能可能原本计划作为R2发布,但因竞争压力而以R1升级版形式推出。

来源:Hugging Face、X平台

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南南阳一马戏团女演员从高空摔落被紧急送医,工作人员最新回应

河南南阳一马戏团女演员从高空摔落被紧急送医,工作人员最新回应

封面新闻
2026-02-19 13:27:10
没人发拜年微信了,这是一个危险的信号

没人发拜年微信了,这是一个危险的信号

茉莉聊聊天
2026-02-18 10:48:40
日本阻止新建穆斯林墓地,网友:他们正在完全拒绝伊斯兰教

日本阻止新建穆斯林墓地,网友:他们正在完全拒绝伊斯兰教

丫头舫
2026-02-18 19:14:08
春晚赞助商换了一拨:机器人5亿,追觅2亿,潮玩卡牌上桌

春晚赞助商换了一拨:机器人5亿,追觅2亿,潮玩卡牌上桌

娱乐资本论
2026-02-18 10:34:52
豪门连遭爆冷:阿森纳2-2狼队 大黑马欧冠3-1国米 马竞3-3遭绝平

豪门连遭爆冷:阿森纳2-2狼队 大黑马欧冠3-1国米 马竞3-3遭绝平

狍子歪解体坛
2026-02-19 06:23:39
从星链落地到全面改革,被低估的越南正在惊人“逆袭”

从星链落地到全面改革,被低估的越南正在惊人“逆袭”

凤眼论
2026-02-19 09:08:18
意难平!广东网友哭诉,回老家发5000红包,孩子收到10块20块回礼

意难平!广东网友哭诉,回老家发5000红包,孩子收到10块20块回礼

火山詩话
2026-02-18 10:00:10
美媒称美军做好周末攻击伊朗准备

美媒称美军做好周末攻击伊朗准备

界面新闻
2026-02-19 07:49:36
日本男子伪造证件闯入驻日美军基地禁区,目前人在中东,身份披露:年龄40余岁,在一家大型综合商业公司工作

日本男子伪造证件闯入驻日美军基地禁区,目前人在中东,身份披露:年龄40余岁,在一家大型综合商业公司工作

大风新闻
2026-02-19 10:07:09
“茶几”正在退出中国家庭,学广东人这样做,实用性让人大开眼界

“茶几”正在退出中国家庭,学广东人这样做,实用性让人大开眼界

室内设计师有料儿
2026-02-19 11:17:18
评论区有人称一家四口亏了4000元

评论区有人称一家四口亏了4000元

上观新闻
2026-02-19 13:01:26
“爸妈来后冰箱都变老了!”网友:原来全国都这样

“爸妈来后冰箱都变老了!”网友:原来全国都这样

深圳晚报
2026-02-18 21:35:41
特朗普,又改口了!

特朗普,又改口了!

环球时报国际
2026-02-19 08:26:37
太尴尬了!大年初一,上海网友哭诉称大门被邻居贴两张“大字报”

太尴尬了!大年初一,上海网友哭诉称大门被邻居贴两张“大字报”

火山詩话
2026-02-19 15:05:12
对不起了,吴京!看完《镖人》,我才知道:是自己“孤陋寡闻”了

对不起了,吴京!看完《镖人》,我才知道:是自己“孤陋寡闻”了

小丸子的娱乐圈
2026-02-18 16:30:40
中国代表团冲5金!谷爱凌最后机会,两大王牌项目强势逆袭?

中国代表团冲5金!谷爱凌最后机会,两大王牌项目强势逆袭?

阿嚼影视评论
2026-02-19 13:37:23
娱乐圈著名6对“死对头”,个个矛盾根深蒂固,至今老死不相往来

娱乐圈著名6对“死对头”,个个矛盾根深蒂固,至今老死不相往来

a入画浅相思
2026-02-18 18:16:12
湖北宜城烟花爆燃12名遇难者身份确认:除店老板外,11人都是顾客

湖北宜城烟花爆燃12名遇难者身份确认:除店老板外,11人都是顾客

Mr王的饭后茶
2026-02-19 12:00:03
苏翊鸣徐梦桃连夺金牌,中国队排名上升5位,两人各获4枚奖牌

苏翊鸣徐梦桃连夺金牌,中国队排名上升5位,两人各获4枚奖牌

老癘体育解说
2026-02-18 22:14:27
48小时大变脸!美国紧急撤回名单,高市急用简体中文向中国低头

48小时大变脸!美国紧急撤回名单,高市急用简体中文向中国低头

东极妙严
2026-02-19 11:55:17
2026-02-19 16:19:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11245文章数 116972关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

日本挖到含稀土泥浆 高市称"下一代、下下代都用不完"

头条要闻

日本挖到含稀土泥浆 高市称"下一代、下下代都用不完"

体育要闻

首金!苏翊鸣唱国歌落泪 自信比1呐喊

娱乐要闻

明星过年百态!黄晓明等现身三亚

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

教育
房产
手机
公开课
军事航空

教育要闻

马年伊始,请带上这10句话整装出发!

房产要闻

顶豪抢房潮席卷全国! 中旅馥棠公馆项目395㎡大平层加推入市!

手机要闻

三星Galaxy S26系列综合前瞻:2nm芯+隐私屏

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

金正恩出席火箭炮赠送仪式 强调确保朝鲜安全环境

无障碍浏览 进入关怀版