网易首页 > 网易号 > 正文 申请入驻

突发!DeepSeek 放出超重磅全新模型R1:对标o1, 实测超出想象的好,今天可用

0
分享至

DeepSeek放大招!DeepSeek-R1-Lite-Preview 震撼登场!推理能力超强,没有黑盒,实时展示推理思考过程,直接叫板OpenAI的o1-preview!

直接看性能

DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,大幅超越了 GPT4o,甚至o1-preview 等知名模型

在六个不同基准测试(AIME 2024、MATH、GPQA Diamond、Codeforces、LiveCodeBench、ZebraLogic)中的表现

AIME 2024:pass@1,模型第一次尝试就给出正确答案的百分比

deepseeker-r1-lite-preview 的表现最佳,达到 52.5%。o1-preview 紧随其后,为 44.6%

MATH:accuracy,模型在数学推理题上的正确率

deepseeker-r1-lite-preview 依然领先,正确率为 91.6%。o1-preview 紧随其后(85.5%),与其他模型拉开较大差距

GPQA Diamond:pass@1,模型在高难度问题上的首答正确率

o1-preview 领先,达到 73.3%,deepseeker-r1-lite-preview 紧随其后,为 58.5%

Codeforces:rating,模型在编程挑战赛中的分数

deepseeker-r1-lite-preview 领先,分数为1450 , o1得分1428

LiveCodeBench:accuracy,编程任务的正确率(2024年8月至11月)

o1-preview 小幅领先,正确率为 53.6%。deepseeker-r1-lite-preview 紧随其后,为 51.6%

ZebraLogic:accuracy,评估逻辑推理任务的正确率

o1-preview 占据第一,为 71.4%,deepseeker-r1-lite-preview 紧随其后,为 56.6%

DeepSeek-R1-Lite-Preview推理缩放

更长的推理,更好的性能。随着思维长度的增加,DeepSeek-R1-Lite-Preview 在 AIME 上的得分稳步提高,这与OpenAI o1 提出推理缩放规律是一致的,由此也可以说明推理缩放具有巨大的潜力

DeepSeek-R1-Lite-Preview实测

实时透明的思维过程!让你清清楚楚地看到AI的思考过程,不再是黑盒!

我测试了几个经典问题:

9.11和9.8哪个大?

9.12和9.9哪个大?

单词 “strawberry”(草莓)有几个r?

单词'blueberrycherryberrycarbonpherry'?有几个r?

回答全都是一次性正确,并且实时的展示出了思考的过程

令我印象非常深刻,如果我没记错,这是我第一次在大模型上测试这些经典问题全部一次性答对,大家可以自己去试试

开源模型和API即将推出!DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。正式版 DeepSeek-R1 模型将完全开源,公开技术报告,部署API

各路网友都在向OpenAI喊话,赶紧放出o1完整版,deepseek太强了,超出了想象

DeepSeek-R1-Lite-Preview现在就可以使用

现在就可以用,每天50个额度! http://chat.deepseek.com

最后说一句:真心觉得deepseek太牛皮了,这是在别人限制我们情况下做出来的,国产之光!

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“南京理工大学”更名背后的争夺战:为何不得不抢东南大学的名号?

“南京理工大学”更名背后的争夺战:为何不得不抢东南大学的名号?

辉哥说动漫
2026-02-02 20:19:26
地主王学文救起晕倒的女红军,她拉开衣襟的那刻,王学文吓一跳

地主王学文救起晕倒的女红军,她拉开衣襟的那刻,王学文吓一跳

磊子讲史
2026-01-06 10:38:15
意外!一场0比4把李金羽打懵了?辽宁队阵容升级,攻防却一盘散沙

意外!一场0比4把李金羽打懵了?辽宁队阵容升级,攻防却一盘散沙

罗掌柜体育
2026-02-02 06:15:05
又揪出来一个巨贪,金额高达9.7亿,首富夫人郝斌跨境逃亡失败了

又揪出来一个巨贪,金额高达9.7亿,首富夫人郝斌跨境逃亡失败了

墨兰史书
2026-01-17 08:30:09
知名品牌突然宣布取消全场9.9元!网友懵了:天天买

知名品牌突然宣布取消全场9.9元!网友懵了:天天买

台州交通广播
2026-01-31 22:30:16
越扒越有!重庆饭店"阴阳菜单"只是冰山一角,知情人曝更炸裂猛料

越扒越有!重庆饭店"阴阳菜单"只是冰山一角,知情人曝更炸裂猛料

丁丁鲤史纪
2026-02-02 09:44:12
今年首月中纪委连打8“虎”,2名中央委员任上被查

今年首月中纪委连打8“虎”,2名中央委员任上被查

上观新闻
2026-02-02 12:31:08
汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

长星寄明月
2026-01-20 21:00:46
“喝了他家的茶,就是他家的人”,毛主席突然道出这句话,一旁的梁兴初顿时心绪沉重

“喝了他家的茶,就是他家的人”,毛主席突然道出这句话,一旁的梁兴初顿时心绪沉重

史海孤雁
2026-02-02 15:39:11
全新宝马X7将于2027年发布!网友:终于是旗舰该有的样子了

全新宝马X7将于2027年发布!网友:终于是旗舰该有的样子了

汽车网评
2026-01-31 21:16:12
101岁余宝珠:相貌普通击败正房,独占百亿资产,抽烟喝酒霸气足

101岁余宝珠:相貌普通击败正房,独占百亿资产,抽烟喝酒霸气足

照见古今
2026-01-09 19:08:21
国家下狠手了!体制内大地震,少爷、公主们的“天”,要塌了

国家下狠手了!体制内大地震,少爷、公主们的“天”,要塌了

霹雳炮
2026-01-19 22:24:13
制霸攻防,艾伦23中16砍40分17板5助2断4帽0失误

制霸攻防,艾伦23中16砍40分17板5助2断4帽0失误

懂球帝
2026-02-02 13:04:24
全球多名权势人物被曝与爱泼斯坦关系密切,特朗普:我清白,我要起诉

全球多名权势人物被曝与爱泼斯坦关系密切,特朗普:我清白,我要起诉

上观新闻
2026-02-02 14:18:29
纽约期银突破87美元/盎司,日内涨10.78%

纽约期银突破87美元/盎司,日内涨10.78%

每日经济新闻
2026-02-02 08:19:11
英媒:中国富人为何逃离新加坡?中国不定居,新加坡也就是个县了

英媒:中国富人为何逃离新加坡?中国不定居,新加坡也就是个县了

老范谈史
2026-02-02 20:43:27
罗马诺爆猛料!曼联或签 2 人,英力士准备砸破队史转会纪录!

罗马诺爆猛料!曼联或签 2 人,英力士准备砸破队史转会纪录!

澜归序
2026-02-02 08:19:58
连续15个跌停板!股民:心都拔凉拔凉的!

连续15个跌停板!股民:心都拔凉拔凉的!

数据挖掘分析
2026-02-02 15:12:57
林傲霏学历风波再升级,被顶替考生李展旭发声,喊话比拼演技!

林傲霏学历风波再升级,被顶替考生李展旭发声,喊话比拼演技!

史行途
2026-02-02 12:02:13
利物浦压哨重磅签约 7000万欧敲定20岁天才中卫 近半年已花5.53亿

利物浦压哨重磅签约 7000万欧敲定20岁天才中卫 近半年已花5.53亿

我爱英超
2026-02-02 07:22:32
2026-02-03 00:35:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1031文章数 396关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

教育
亲子
数码
时尚
手机

教育要闻

家长反映高一学生无一教辅、依赖打印资料,教育局回应

亲子要闻

萌娃哄生气的妈妈,人小鬼大逗得妈妈生不起气来了

数码要闻

格力再强调暂无铝代铜计划!铝和铜各方面存在较大差距

裤子+靴子:今年冬天最经典搭配,松弛又时髦!

手机要闻

消息称三星Galaxy S27 Ultra将搭载更安全的Polar ID面部识别技术

无障碍浏览 进入关怀版