网易首页 > 网易号 > 正文 申请入驻

DeepSeek节前又双叒叕搞事,R1“小版本试更新”代码能力实测堪比Claude 4

0
分享至

作者|沐风

来源|AI先锋官

临近端午假期,DeepSeek官方宣布DeepSeek R1模型已完成小版本试升级,欢迎前往官方网页、App、小程序测试(打开深度思考),API接口和使用方式保持不变。

果然符合DeepSeek的作风,节前搞事。

紧接着,在今天凌晨,官方又在HuggingFace上开源了DeepSeek-R1-0528。

开源地址:

https://huggingface.co/DeepSeek-ai/DeepSeek-R1-0528/tree/main

不过,DeepSeek官方此次并没有公布版本更新的具体内容。

有消息称,该模型是基于DeepSeek-V3-0324训练(参数为660B)。

据众多开发者测试发现,DeepSeek-R1-0528目前提升最为明显的也是代码能力。

在代码测试平台Live CodeBench中,其性能几乎媲美OpenAI的o3-high和o4-mini(Medium)超越了Gemini 2.5 Flash。

AI博主同时也是KCORES开源硬件项目联合创始人“karminski-牙医”使用DeepSeek-R1-0528和Claude-4-Sonnet进行了对比测试。

在Prompt相同,且一次性生成的情况下, Claude-4-Sonnet生成了542行, DeepSeek-R1-0528生成了728行。

从平面的橙色漫反射、控制面板的美观程度、撞击后的运动方向等效果上看,DeepSeek-R1-0528更加出色。

另外,根据其他网友的测试结果显示,DeepSeek-R1-0528在前端设计的审美、编码能力上也已经达到了Claude 4 Sonnet水准。

例如:

大家可以自行对比。

X博主Haider.更是直接称赞到“这是我在这个任务上测试过的最好的模型”,他让DeepSeek-R1-0528构建一个单词评分系统。

DeepSeek-R1-0528简要思考后,一次性生成两个文件,一个是主程序,一个是测试脚本,代码结构清晰,逻辑闭环,首次运行就顺利通过,没有报错。

该博主称,此前,o3是唯一能完成这个任务的模型,DeepSeek-R1-0528是第二个,堪称是完成这个任务的最佳型。

不过,DeepSeek-R1-0528在编程能力的全面性上还是有一点点不足。

例如,缺少多模态能力,它不能像Claud那样通过截图来描述代码错误,调试比较麻烦。

但即便如此,它在代码生成方面已经稳稳站在了Claude 3.7和Claude 4之间的水平。

另外,它的进步也远不止于代码能力。

“karminski-牙医”还对其进行了文本召回测试。

发现DeepSeek-R1-0528在上下文32K以内比之前的R1模型要好不少,但是在60K的上下文中效果下降了不少。

这意味着在32K以内针对给定的材料向DeepSeek-R1-0528提问问题,它回答的准确度会更好。

同时,也有开发者总结此次更新的另外几个亮点:

·能像Google模型一样深度推理文本生成优化;

·写作任务,更自然、格式更好;

·不仅仅是快速,而且深思熟虑;

·单任务处理时长可达30-60分钟。

不过,最具争议的一点是,思考时间更长,有网友实测后,R1思考时长超过了25分钟。

有网友认为,它的思考过程之所以很长,是为了弥补推理能力,导致响应速度比较慢。

但也有网友认为,长思考可以让它给出的答案更加准确。

例如,有网友提到,DeepSeek-R1-0528是目前唯一一个能稳定正确回答“9.9-9.11 等于多少?”的模型。

虽然官方称此次R1是“小版本试升级”,但在网友看来却是一次实打实的真升级。

许多网友不禁让感叹,如果这是R1,那么R2会有多好?

但此次DeepSeek-R1-0528的发布也意味着R2恐怕还得再等等。

DeepSeek该不会觉得只要不是模型架构更新,只是能力变强就不算大版本升级?

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张一鸣登顶,雷军排第十,2026富豪榜大洗牌:十年河东十年河西

张一鸣登顶,雷军排第十,2026富豪榜大洗牌:十年河东十年河西

大卫聊科技
2026-02-02 12:37:28
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
大快人心!明家才刚走,白家后脚跟上,春节前全部要送走的节奏啊

大快人心!明家才刚走,白家后脚跟上,春节前全部要送走的节奏啊

火山诗话
2026-02-02 12:32:32
春运首日 全社会跨区域人员流动量超1.8亿人次

春运首日 全社会跨区域人员流动量超1.8亿人次

环球网资讯
2026-02-02 19:25:18
1969年,苏联为何放弃用核武器轰炸中国?多年以后,叛逃的苏方高层终于说出了缘由

1969年,苏联为何放弃用核武器轰炸中国?多年以后,叛逃的苏方高层终于说出了缘由

史海孤雁
2026-01-23 15:26:12
朝鲜战争期间:美军原本已接近击败中国,却碰上中国决死的指挥官

朝鲜战争期间:美军原本已接近击败中国,却碰上中国决死的指挥官

千秋文化
2026-01-31 21:14:51
丹尼-格林:就因为是詹姆斯和湖人夺冠,外界长期黑园区冠军

丹尼-格林:就因为是詹姆斯和湖人夺冠,外界长期黑园区冠军

懂球帝
2026-02-02 18:11:06
西媒:特狮肌肉受伤,或返回巴萨

西媒:特狮肌肉受伤,或返回巴萨

体坛周报
2026-02-02 19:42:11
A股午评:三大指数均跌超1%,全市场3500只股票下跌,黄金、贵金属、石油石化等概念走弱

A股午评:三大指数均跌超1%,全市场3500只股票下跌,黄金、贵金属、石油石化等概念走弱

界面新闻
2026-02-02 11:34:20
中国下达禁令,委内瑞拉石油遇冷,特朗普看情况不对,向中国喊话

中国下达禁令,委内瑞拉石油遇冷,特朗普看情况不对,向中国喊话

铁锤简科
2026-02-02 15:30:28
田华:一路好走,一家四口都是癌症,却拒绝200万广告代言

田华:一路好走,一家四口都是癌症,却拒绝200万广告代言

潘蠸旅行浪子
2026-01-14 03:43:09
1975年毛主席与儿女见面时,江青提议让李讷暂任北京市委书记,最终结果怎样?

1975年毛主席与儿女见面时,江青提议让李讷暂任北京市委书记,最终结果怎样?

寄史言志
2026-01-20 13:57:07
迪拜最帅王子哈曼丹:43岁颜值大滑坡,身高不足1.7米又矮又邋遢

迪拜最帅王子哈曼丹:43岁颜值大滑坡,身高不足1.7米又矮又邋遢

墨印斋
2026-02-01 21:49:28
李小璐写真生图高清

李小璐写真生图高清

翩翩明星
2025-11-14 09:39:36
山西一城中村原村长、书记贪腐细节曝光,非法获利5300余万元

山西一城中村原村长、书记贪腐细节曝光,非法获利5300余万元

朔州那些事儿
2026-02-02 18:36:43
前女友举报孙宇晨,再曝其与谷爱凌恋爱

前女友举报孙宇晨,再曝其与谷爱凌恋爱

小椰的奶奶
2026-02-02 15:02:05
中国老年痴呆人数全球第一:茶喝的越多,痴呆的就越多,真的吗?

中国老年痴呆人数全球第一:茶喝的越多,痴呆的就越多,真的吗?

蜉蝣说
2026-01-22 11:57:36
“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

妍妍教育日记
2026-01-30 20:54:12
55年,潘汉年在北京饭店被秘密逮捕,陈毅怒斥:糊涂,不可饶恕

55年,潘汉年在北京饭店被秘密逮捕,陈毅怒斥:糊涂,不可饶恕

大运河时空
2026-02-01 12:25:03
当年计划生育标语,为何成了现在的“真理”?

当年计划生育标语,为何成了现在的“真理”?

深度报
2026-02-01 22:42:39
2026-02-02 21:35:00
AI先锋官 incentive-icons
AI先锋官
AIGC大模型及应用精选与评测
425文章数 50关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

本地
亲子
数码
教育
旅游

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

亲子要闻

萌娃和爸爸抢妈妈,逻辑太强了,让爸爸无奈苦笑

数码要闻

马年含金量最高的耳机!华为联名周大福 FreeClip 2黄金耳饰细节公布

教育要闻

2月7日活动报名 | 北大光华-凯洛格国际EMBA线上宣讲会

旅游要闻

雪域同心·青春融情——记台青冬令营新疆之旅

无障碍浏览 进入关怀版