网易首页 > 网易号 > 正文 申请入驻

突发!DeepSeek 放出超重磅全新模型R1:对标o1, 实测超出想象的好,今天可用

0
分享至

DeepSeek放大招!DeepSeek-R1-Lite-Preview 震撼登场!推理能力超强,没有黑盒,实时展示推理思考过程,直接叫板OpenAI的o1-preview!

直接看性能

DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,大幅超越了 GPT4o,甚至o1-preview 等知名模型

在六个不同基准测试(AIME 2024、MATH、GPQA Diamond、Codeforces、LiveCodeBench、ZebraLogic)中的表现

AIME 2024:pass@1,模型第一次尝试就给出正确答案的百分比

deepseeker-r1-lite-preview 的表现最佳,达到 52.5%。o1-preview 紧随其后,为 44.6%

MATH:accuracy,模型在数学推理题上的正确率

deepseeker-r1-lite-preview 依然领先,正确率为 91.6%。o1-preview 紧随其后(85.5%),与其他模型拉开较大差距

GPQA Diamond:pass@1,模型在高难度问题上的首答正确率

o1-preview 领先,达到 73.3%,deepseeker-r1-lite-preview 紧随其后,为 58.5%

Codeforces:rating,模型在编程挑战赛中的分数

deepseeker-r1-lite-preview 领先,分数为1450 , o1得分1428

LiveCodeBench:accuracy,编程任务的正确率(2024年8月至11月)

o1-preview 小幅领先,正确率为 53.6%。deepseeker-r1-lite-preview 紧随其后,为 51.6%

ZebraLogic:accuracy,评估逻辑推理任务的正确率

o1-preview 占据第一,为 71.4%,deepseeker-r1-lite-preview 紧随其后,为 56.6%

DeepSeek-R1-Lite-Preview推理缩放

更长的推理,更好的性能。随着思维长度的增加,DeepSeek-R1-Lite-Preview 在 AIME 上的得分稳步提高,这与OpenAI o1 提出推理缩放规律是一致的,由此也可以说明推理缩放具有巨大的潜力

DeepSeek-R1-Lite-Preview实测

实时透明的思维过程!让你清清楚楚地看到AI的思考过程,不再是黑盒!

我测试了几个经典问题:

9.11和9.8哪个大?

9.12和9.9哪个大?

单词 “strawberry”(草莓)有几个r?

单词'blueberrycherryberrycarbonpherry'?有几个r?

回答全都是一次性正确,并且实时的展示出了思考的过程

令我印象非常深刻,如果我没记错,这是我第一次在大模型上测试这些经典问题全部一次性答对,大家可以自己去试试

开源模型和API即将推出!DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。正式版 DeepSeek-R1 模型将完全开源,公开技术报告,部署API

各路网友都在向OpenAI喊话,赶紧放出o1完整版,deepseek太强了,超出了想象

DeepSeek-R1-Lite-Preview现在就可以使用

现在就可以用,每天50个额度! http://chat.deepseek.com

最后说一句:真心觉得deepseek太牛皮了,这是在别人限制我们情况下做出来的,国产之光!

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
四川省人大常委会副主任何礼履新成都市人大常委会党组书记

四川省人大常委会副主任何礼履新成都市人大常委会党组书记

澎湃新闻
2026-01-27 23:05:15
这种打扮把微胖女生的身材优势完美展现出来了

这种打扮把微胖女生的身材优势完美展现出来了

美女穿搭分享
2026-01-26 17:52:02
“理想汽车将关闭100家门店”上热搜

“理想汽车将关闭100家门店”上热搜

电动知家
2026-01-27 11:20:26
身价百亿,坐拥北京一条街,出门私人飞机,京圈顶级富婆天团来了

身价百亿,坐拥北京一条街,出门私人飞机,京圈顶级富婆天团来了

不写散文诗
2026-01-26 23:24:02
北约秘书长:北约不会介入伊朗局势

北约秘书长:北约不会介入伊朗局势

参考消息
2026-01-27 11:34:12
女生要主动起来跟想象中完全不一样!网友:让我递毛巾 瞬间开窍了

女生要主动起来跟想象中完全不一样!网友:让我递毛巾 瞬间开窍了

另子维爱读史
2026-01-26 18:39:06
92年钱其琛亲赴平壤,通报中韩将建交,80岁金日成的表现让人钦佩

92年钱其琛亲赴平壤,通报中韩将建交,80岁金日成的表现让人钦佩

雍亲王府
2026-01-28 15:20:03
牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

春露秋霜
2026-01-16 06:27:20
DeepSeek半夜更新OCR2,用的却是阿里的Qwen

DeepSeek半夜更新OCR2,用的却是阿里的Qwen

卢松松
2026-01-28 13:34:26
官方:耐克公布中超2026赛季16支俱乐部主场球衣

官方:耐克公布中超2026赛季16支俱乐部主场球衣

懂球帝
2026-01-28 11:15:13
男装商家不使用巨型吊牌防止恶意退货!网友:男人买衣看的是质感

男装商家不使用巨型吊牌防止恶意退货!网友:男人买衣看的是质感

火山诗话
2026-01-27 07:47:46
博物馆把“盗洞”都展出来了,只差10厘米,满地黄金就难逃毒手

博物馆把“盗洞”都展出来了,只差10厘米,满地黄金就难逃毒手

收藏大视界
2026-01-27 17:06:01
关系藏不住了?华晨宇殷秀梅手挽手下班引发热议,恶心的一幕出现

关系藏不住了?华晨宇殷秀梅手挽手下班引发热议,恶心的一幕出现

李健政观察
2026-01-28 11:02:09
百万问界背后:赛力斯半年市值蒸发800亿

百万问界背后:赛力斯半年市值蒸发800亿

每人Auto
2026-01-27 14:20:02
德州仪器盘后大涨近9% 数据中心成主要增长动力

德州仪器盘后大涨近9% 数据中心成主要增长动力

财联社
2026-01-28 11:47:09
柯文哲新工作!将领军台湾民众党人才培训机构,开班辅导候选人

柯文哲新工作!将领军台湾民众党人才培训机构,开班辅导候选人

海峡导报社
2026-01-28 15:30:05
乌克兰通过法律程序,将“俄乌战争”,命名为“乌克兰独立战争”

乌克兰通过法律程序,将“俄乌战争”,命名为“乌克兰独立战争”

我心纵横天地间
2026-01-22 18:41:25
上海房价会暴跌?内行说透:3类房必跌,核心区反而硬支撑!

上海房价会暴跌?内行说透:3类房必跌,核心区反而硬支撑!

说故事的阿袭
2026-01-27 15:25:00
李银桥在回忆录中提及毛岸英牺牲需由彭德怀承担一定责任,但这一表述缺乏充分依据,难以成立

李银桥在回忆录中提及毛岸英牺牲需由彭德怀承担一定责任,但这一表述缺乏充分依据,难以成立

史海残云
2025-12-23 11:22:17
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
2026-01-28 16:07:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1030文章数 395关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

运动员退役后到山区支教:卖掉36块奖牌 与女友分手

头条要闻

运动员退役后到山区支教:卖掉36块奖牌 与女友分手

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

王祖贤入驻某音:一条7秒视频吸粉55万

财经要闻

40倍杠杆断裂!水贝一黄金平台兑付困难

汽车要闻

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

态度原创

亲子
健康
旅游
家居
公开课

亲子要闻

液体钙哪个牌子好?十款权威认证儿童液体钙品牌,归一食口碑推荐

耳石症分类型,症状大不同

旅游要闻

梦幻“冰世界”

家居要闻

跃式别墅 包络石木为生

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版