网易首页 > 网易号 > 正文 申请入驻

DeepSeek R1升级,性能接近o3与Gemini,幻觉率大幅降低!

0
分享至

前言

AI模型卷进深水区:DeepSeek-R1-0528,不再追赶,而是在逼近上限,国产大模型的升级节奏,比我们预想得更凶猛。

就在大家都以为DeepSeek R1只是一个中规中矩的技术形象时,0528小版本的悄然放出,却展现了一个明显不同的走向。

这次它不是拼速度,而是重推理、讲深度,在复杂任务中硬啃思维链条,释放出国产模型真正有望冲击国际顶尖梯队的信号。

我们得先明确一点:DeepSeek-R1-0528不是换底座,它还是那个DeepSeek V3 Base,只是这次它在后训练阶段砸下了更大的算力筹码,代价是昂贵的,但回报也实实在在。

在AIME 2025数学推理测试中,新版准确率从70%跃升至87.5%,这个成绩背后的深意绝不能被表面数字所掩盖——它代表了国产模型第一次在极其严苛的逻辑任务中“站稳了脚”。

更有趣的是,它不是靠“猜得准”,而是实打实把平均解题token长度从12K提升到了23K。

这几乎等于思维深度翻了一倍,意味着模型在每一道题目上的“思考”都更加细致,逻辑链条更长,也更少“跳步”。

这背后不仅是算力的投入,更是训练逻辑的优化成果——DeepSeek没有简单堆砌模型参数,而是围绕“推理路径”做了大量系统性的调整,尤其是对幻觉率、结构写作、工具调用等方面的多维调优。

说到幻觉,这是很多中文大模型目前还无法根治的“老毛病”。

但0528版的R1对幻觉率的抑制已经达到了45%-50%,在资讯改写、摘要总结等场景中,能显著减少不靠谱内容。

这点对内容从业者来说是重大利好——你终于可以更大胆地用模型来协助写作而不怕“瞎编”。

但这次升级最让我感兴趣的,并不是R1模型本身,而是DeepSeek把这个思维链条提取出来,蒸馏进了另一个8B模型——DeepSeek-R1-0528-Qwen3-8B。

我们知道,小模型能不能“学会思考”一直是业内悬而未解的问题。DeepSeek的做法是,把R1的“思维轨迹”作为训练目标,迁移给Qwen3-8B。

这波操作让后者在AIME 2024中表现直逼23B的Qwen3-235B,而本身只有8B体积,这说明什么?说明小模型“不是不能思考”,只是它们以前没有受过“深度思考的熏陶”。

可以预见,这种思维链条的“知识迁移”在未来会成为训练轻量模型的标配,既省资源,又提高了智能密度。

从更高的视角看,DeepSeek-R1-0528代表着国产模型向“解释型AI”迈出关键一步。它不是一个黑箱输出工具,而是在努力让用户“看见”它的逻辑过程。

新版API支持Function Calling和Json Output,同时max_tokens也终于从“输出长度限制”进化成“全流程长度上限”的定义。这些改变看似细节,却意味着模型服务正逐步从“结果导向”向“过程透明”过渡。

重点来了,官方提供的上下文依旧为64K,但R1-0528的开源版本上下文长度已经扩展到128K。

这对需要处理复杂长文档、多轮上下文的任务极具吸引力,也说明DeepSeek开始在“模型体验”层面与国际大厂看齐。

我们得承认,在高端模型上,DeepSeek还未完全与o3、Claude 4并肩;但它的某些指标、特别是在数学和工具调用的表现上,已经实现局部追平。

它没有造出新“巨兽”,却用一次小版本,把国产模型的“推理极限”往前推进了一大截。

结语:

DeepSeek-R1-0528的意义,可能不会立刻显现。

但当我们回顾这段AI演进历史时,也许会发现,正是这种一次次“内功优化式”的小步升级,才构成了国产模型逐步拉近世界第一梯队的阶梯。

不是每次迭代都需要重做地基,关键是你有没有能力让旧体系里生出新火花。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拜仁喷裁判:他哪有执法资格?鸡哥:比三冠赛季更棒

拜仁喷裁判:他哪有执法资格?鸡哥:比三冠赛季更棒

体坛周报
2026-05-07 08:15:14
曝知名网红徐州大表哥塌房!用爱国人设赚钱,花6百万移民法国

曝知名网红徐州大表哥塌房!用爱国人设赚钱,花6百万移民法国

裕丰娱间说
2026-05-06 15:55:19
湖人遭重创!肯纳德G2出战成疑,布朗尼要临危受命?

湖人遭重创!肯纳德G2出战成疑,布朗尼要临危受命?

仰卧撑FTUer
2026-05-07 09:25:02
王心凌在深圳演出中遇意外:舞台镭射激光设备失控,强光直射王心凌腿部;网友反映激光长时间大面积扫射观众席,致手机相机镜头等设备损坏

王心凌在深圳演出中遇意外:舞台镭射激光设备失控,强光直射王心凌腿部;网友反映激光长时间大面积扫射观众席,致手机相机镜头等设备损坏

洪观新闻
2026-05-06 12:06:56
太高明!站在中国领土上,伊外长只提一个请求,特朗普急喊话中国

太高明!站在中国领土上,伊外长只提一个请求,特朗普急喊话中国

乐天闲聊
2026-05-07 09:47:19
赖清德回台不到24小时,卢秀燕付出代价,鲁比奥:送台当局一句话

赖清德回台不到24小时,卢秀燕付出代价,鲁比奥:送台当局一句话

潋滟晴方DAY
2026-05-06 20:30:13
55比0全票通过!菲律宾副总统萨拉被正式“围猎”,面临政治终局

55比0全票通过!菲律宾副总统萨拉被正式“围猎”,面临政治终局

兴史兴谈
2026-05-06 06:46:44
一块H200芯片都没卖出去!黄仁勋不装了:中国不应获得最先进芯片

一块H200芯片都没卖出去!黄仁勋不装了:中国不应获得最先进芯片

混沌录
2026-05-06 16:51:09
向太再爆猛料:李连杰黄秋燕离婚根本不是因为利智!而是另有原因

向太再爆猛料:李连杰黄秋燕离婚根本不是因为利智!而是另有原因

孤城落日
2026-05-06 21:52:26
转账5千要查祖宗,内鬼卷走1800万却一路绿灯!银行双标太离谱了

转账5千要查祖宗,内鬼卷走1800万却一路绿灯!银行双标太离谱了

今朝牛马
2026-05-06 21:00:56
末节5投0中!乔治拼命打铁,76人再输尼克斯

末节5投0中!乔治拼命打铁,76人再输尼克斯

德译洋洋
2026-05-07 11:04:17
以军空袭加沙多地致死5人,哈马斯高官之子重伤

以军空袭加沙多地致死5人,哈马斯高官之子重伤

界面新闻
2026-05-07 07:57:20
DeepSeek版Claude Code登顶热榜:8700星,鲸鱼哥火了

DeepSeek版Claude Code登顶热榜:8700星,鲸鱼哥火了

机器之心Pro
2026-05-06 14:09:00
央视军事官宣:中国首艘核动力航母正式确认

央视军事官宣:中国首艘核动力航母正式确认

Ck的蜜糖
2026-05-07 10:50:10
撤离!莫斯科直接亮明底线,若红场阅兵受扰,基辅中心将被夷平

撤离!莫斯科直接亮明底线,若红场阅兵受扰,基辅中心将被夷平

潮鹿逐梦
2026-05-06 16:38:28
梅根晒照为阿奇庆生,7岁小王子罕见曝光

梅根晒照为阿奇庆生,7岁小王子罕见曝光

影视情报室
2026-05-07 06:07:11
升队史第一!爱德华兹48场季后赛超越加内特 打破尘封22年纪录

升队史第一!爱德华兹48场季后赛超越加内特 打破尘封22年纪录

醉卧浮生
2026-05-07 10:11:17
生前喊没绑紧!16岁女粉举应援旗坠亡悬崖秋千!宋亚轩发文回应

生前喊没绑紧!16岁女粉举应援旗坠亡悬崖秋千!宋亚轩发文回应

草莓解说体育
2026-05-07 00:13:37
2比0!一只脚踏进东决!NBA季后赛最强进攻

2比0!一只脚踏进东决!NBA季后赛最强进攻

篮球教学论坛
2026-05-07 10:49:06
越来越猖狂的早餐店“铝包子”,我们应提高警惕,该如何辨别呢?

越来越猖狂的早餐店“铝包子”,我们应提高警惕,该如何辨别呢?

心中的麦田
2026-05-04 18:47:55
2026-05-07 11:44:49
小8说科技 incentive-icons
小8说科技
商务请私
6734文章数 342关注度
往期回顾 全部

科技要闻

凌晨突发!马斯克租22万块GPU给“死敌”

头条要闻

北京三位女大学生青海自驾游2死1伤 伤者一审获刑4年

头条要闻

北京三位女大学生青海自驾游2死1伤 伤者一审获刑4年

体育要闻

阿森纳巴黎会师欧冠决赛!5月31日开战

娱乐要闻

小S阿雅重返大S母校,翻看大S毕业照

财经要闻

特朗普:美伊“很有可能”达成协议

汽车要闻

理想为什么不做轿车,有了解释……

态度原创

教育
艺术
数码
本地
军事航空

教育要闻

【数育未来专家谈·第一期】智能思政课堂、精准德育关怀、沉浸式育人场景……数字教育如何为德育工作提质增...

艺术要闻

这位老教授笔下的青年,活力满满

数码要闻

微软委托报告:Win11笔记本比苹果MacBook Neo更有竞争力

本地新闻

用青花瓷的方式,打开西溪湿地

军事要闻

特朗普:美伊"很可能"达成协议

无障碍浏览 进入关怀版