网易首页 > 网易号 > 正文 申请入驻

突发!DeepSeek 放出超重磅全新模型R1:对标o1, 实测超出想象的好,今天可用

0
分享至

DeepSeek放大招!DeepSeek-R1-Lite-Preview 震撼登场!推理能力超强,没有黑盒,实时展示推理思考过程,直接叫板OpenAI的o1-preview!

直接看性能

DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,大幅超越了 GPT4o,甚至o1-preview 等知名模型

在六个不同基准测试(AIME 2024、MATH、GPQA Diamond、Codeforces、LiveCodeBench、ZebraLogic)中的表现

AIME 2024:pass@1,模型第一次尝试就给出正确答案的百分比

deepseeker-r1-lite-preview 的表现最佳,达到 52.5%。o1-preview 紧随其后,为 44.6%

MATH:accuracy,模型在数学推理题上的正确率

deepseeker-r1-lite-preview 依然领先,正确率为 91.6%。o1-preview 紧随其后(85.5%),与其他模型拉开较大差距

GPQA Diamond:pass@1,模型在高难度问题上的首答正确率

o1-preview 领先,达到 73.3%,deepseeker-r1-lite-preview 紧随其后,为 58.5%

Codeforces:rating,模型在编程挑战赛中的分数

deepseeker-r1-lite-preview 领先,分数为1450 , o1得分1428

LiveCodeBench:accuracy,编程任务的正确率(2024年8月至11月)

o1-preview 小幅领先,正确率为 53.6%。deepseeker-r1-lite-preview 紧随其后,为 51.6%

ZebraLogic:accuracy,评估逻辑推理任务的正确率

o1-preview 占据第一,为 71.4%,deepseeker-r1-lite-preview 紧随其后,为 56.6%

DeepSeek-R1-Lite-Preview推理缩放

更长的推理,更好的性能。随着思维长度的增加,DeepSeek-R1-Lite-Preview 在 AIME 上的得分稳步提高,这与OpenAI o1 提出推理缩放规律是一致的,由此也可以说明推理缩放具有巨大的潜力

DeepSeek-R1-Lite-Preview实测

实时透明的思维过程!让你清清楚楚地看到AI的思考过程,不再是黑盒!

我测试了几个经典问题:

9.11和9.8哪个大?

9.12和9.9哪个大?

单词 “strawberry”(草莓)有几个r?

单词'blueberrycherryberrycarbonpherry'?有几个r?

回答全都是一次性正确,并且实时的展示出了思考的过程

令我印象非常深刻,如果我没记错,这是我第一次在大模型上测试这些经典问题全部一次性答对,大家可以自己去试试

开源模型和API即将推出!DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。正式版 DeepSeek-R1 模型将完全开源,公开技术报告,部署API

各路网友都在向OpenAI喊话,赶紧放出o1完整版,deepseek太强了,超出了想象

DeepSeek-R1-Lite-Preview现在就可以使用

现在就可以用,每天50个额度! http://chat.deepseek.com

最后说一句:真心觉得deepseek太牛皮了,这是在别人限制我们情况下做出来的,国产之光!

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方开始清场?日本下令,所有渔船撤离钓鱼岛,高市当众哭泣!

中方开始清场?日本下令,所有渔船撤离钓鱼岛,高市当众哭泣!

悠悠写故事
2026-01-28 17:37:46
什么是牢A的“三通一达”?解释清楚了!

什么是牢A的“三通一达”?解释清楚了!

雪中风车
2026-01-27 19:50:37
内娱的"下限"又被刷新了!葛晓倩再曝料张雨绮,荒唐的事不止一件

内娱的"下限"又被刷新了!葛晓倩再曝料张雨绮,荒唐的事不止一件

秋姐居
2026-01-27 11:34:34
飞天茅台价格全线上涨

飞天茅台价格全线上涨

第一财经资讯
2026-01-29 00:24:20
相声新势力彻底没了!打了2年的官司有了结果,卢鑫完败玉浩全胜

相声新势力彻底没了!打了2年的官司有了结果,卢鑫完败玉浩全胜

观察鉴娱
2026-01-28 10:35:08
顶流巨星:已退圈,宁肯做农民

顶流巨星:已退圈,宁肯做农民

视觉志
2026-01-27 10:34:11
央行重磅发声:将采取措施推动物价回升,全面涨价潮来临?

央行重磅发声:将采取措施推动物价回升,全面涨价潮来临?

特约前排观众
2026-01-28 00:15:03
Lisa去车公庙上香,穿lululemon瑜伽裤臀很翘,她素颜长相很普通

Lisa去车公庙上香,穿lululemon瑜伽裤臀很翘,她素颜长相很普通

有范又有料
2026-01-25 19:23:45
乔治今日命中9记三分,追平76人队史纪录

乔治今日命中9记三分,追平76人队史纪录

懂球帝
2026-01-28 14:06:06
收受21名老板现金、黄金、书画等贿赂,来者不拒、大小通吃!武华太忏悔:“害了家人,害了亲属,害了下属,害了一大堆人……”

收受21名老板现金、黄金、书画等贿赂,来者不拒、大小通吃!武华太忏悔:“害了家人,害了亲属,害了下属,害了一大堆人……”

每日经济新闻
2026-01-27 18:34:50
登上好莱坞标志挂内衣?“悉尼妹”这次玩得有点大!

登上好莱坞标志挂内衣?“悉尼妹”这次玩得有点大!

粉红冻奶的观影日记
2026-01-28 17:32:38
卖掉5年油车换电车,开2年后坦言:这些网上说法都是真的

卖掉5年油车换电车,开2年后坦言:这些网上说法都是真的

复转这些年
2026-01-24 22:57:39
碎三观!刚收未婚夫18万彩礼,武汉25岁姑娘扭头给外国前男友留言

碎三观!刚收未婚夫18万彩礼,武汉25岁姑娘扭头给外国前男友留言

火山诗话
2026-01-26 07:47:27
台湾回归后的地位,王毅用5个字定调了,民进党:2300万人不接受

台湾回归后的地位,王毅用5个字定调了,民进党:2300万人不接受

爱史纪
2026-01-27 15:20:55
马德兴:邵佳一主动把国脚数据发回俱乐部,还与斯卢茨基面谈

马德兴:邵佳一主动把国脚数据发回俱乐部,还与斯卢茨基面谈

懂球帝
2026-01-28 16:46:07
刘知远:建立了最短命的正统王朝,也缔造了惊艳四座的历史传奇

刘知远:建立了最短命的正统王朝,也缔造了惊艳四座的历史传奇

掠影后有感
2026-01-28 10:35:07
巴克利:太阳队狄龙·布鲁克斯凭借本赛季表现,理应入选全明星

巴克利:太阳队狄龙·布鲁克斯凭借本赛季表现,理应入选全明星

好火子
2026-01-29 01:33:11
二战结束男女比例失调,为解决女子生活问题,苏联想出一个小妙招

二战结束男女比例失调,为解决女子生活问题,苏联想出一个小妙招

叹为观止易
2026-01-17 09:55:42
红网:一场关于“穿透”的视觉革命

红网:一场关于“穿透”的视觉革命

疾跑的小蜗牛
2026-01-28 20:35:41
266比199,日本政坛黑马杀出?对华态度成亮点,特朗普或抛弃高市

266比199,日本政坛黑马杀出?对华态度成亮点,特朗普或抛弃高市

回京历史梦
2026-01-27 21:08:38
2026-01-29 02:04:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1030文章数 395关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

俄总统助理:泽连斯基若愿与普京会晤 可来莫斯科

头条要闻

俄总统助理:泽连斯基若愿与普京会晤 可来莫斯科

体育要闻

没天赋的CBA第一小前锋,秘诀只有一个字

娱乐要闻

金子涵拉黑蔡徐坤,蔡徐坤工作室回应

财经要闻

从万科退休20天后,郁亮疑似失联

汽车要闻

新手必看!冰雪路面不敢开?记住这4点 关键时刻真能保命

态度原创

数码
手机
亲子
旅游
公开课

数码要闻

荣耀平板新春版本今启推送,升级计划公布

手机要闻

HyperOS 3.1淘汰名单:REDMI K60、POCO F5在列,有你的手机吗

亲子要闻

促排期间可以吃什么长卵泡?amh低怎么办怎么调理?

旅游要闻

普陀:城市亲水公园美丽景色等你来解锁

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版