网易首页 > 网易号 > 正文 申请入驻

DeepSeek R1 彻底出圈:震动整个AI行业,高强度刷爆社媒,赞誉,恐慌,破防,八卦全都来了

0
分享至

DeepSeek R1 彻底出圈了,R1的冲击波经过几天的酝酿,今天似乎达到了一个高点,小编时间线被刷爆了,总结起来有两点给大家分享一下,非常有意思:首先R1经受住了多个权威基准测试,其次R1带来了大量八卦和破防,当然还有福利,因为R1 Sam Altman 宣布o3 mini 免费可用(有查询次数限制)

直接上图,大家看看

权威基准测试

三张图无可争辩的说明 DeepSeek R1的强大: DeepSeek R1在大模型竞技场 Chatbot Arena,以及其他两个无法提前被黑客入侵的独立基准(Artificial-Analysis, HLE)经受住考验
1.大模型竞技场排名

DeepSeek-R1 大模型竞技场排行出炉,挺进前三!性能直逼顶尖。LM Arena (原 lmsys.org) 称 DeepSeek-R1 的表现令人瞩目,并称赞其为社区带来了一份“令人难以置信的里程碑和礼物”

DeepSeek-R1 的亮点包括:综合排名第三:DeepSeek-R1 目前在 LM Arena 综合榜单上排名第三,与顶尖推理模型 o1 并列,展现了强大的通用能力技术领域表现卓越:

在 "Hard Prompts" (高难度提示词)、 "Coding" (代码能力) 和 "Math" (数学能力) 等技术性极强的领域,DeepSeek-R1 更是拔得头筹,位列第一风格控制并列第一:

在 "Style Control" (风格控制) 方面,DeepSeek-R1 也展现了惊人的实力,与 o1 并列第一,意味着模型在理解和遵循用户指令,并按照特定风格生成内容方面表现出色推文还指出,

在 "Hard Prompt with Style Control" (高难度提示词与风格控制结合)的测试中,DeepSeek-R1 更是与 o1 并列第一,进一步证明了其在复杂任务和精细化控制方面的强大能力

虽然目前的排名是基于早期的结果,更多投票正在收集中以确保排名的稳定性,但 DeepSeek-R1 已经展现出在各个领域都非常强劲的潜力

2.人类最后的考试 测试

这个测试是昨天刚刚发布的,难度非常高,是Scale AI 和CAIS 公布的一项突破性的新基准,这是人类知识前沿的多模式基准,旨在成为同类中最后一个学科覆盖面广的封闭式学术基准。该数据集由跨越一百多个学科的 3,000 道挑战性试题组成。公开发布这些问题,同时保留了一个不公开的测试集,用于评估模型的过拟合情况

R1 排名第一

Artificial-Analysis

Artificial-Analysis 对人工智能模型和应用程序接口提供商进行独立分析, 了解人工智能的现状,为您的使用案例选择最佳模型和提供商

R1排名第二(比O1便宜25倍)

其他测试

webdev 测试R1 排名第二

R1+Sonnet 就是 aider 多语言编码的 SOTA 方案,比01 还高 2%,R1做架构,Sonnet 干活

赞誉,破防,恐慌以及八卦

杨立坤赞扬deepseek,杨立坤转发并且夸奖了 R1项目,表示开源会加速 AI 进步

对于那些看到 DeepSeek 性能并认为:“中国正在超越美国在人工智能领域”的人们,你们理解错了。正确的理解应该是:“开源模型正在超越专有模型。”

DeepSeek 从开源研究和开源技术中受益(例如 Meta 的 PyTorch 和 Llama)他们提出了新的想法,并在其他人的工作基础上进行了构建,由于他们的工作是公开发布和开源的,大家都可以从中受益,这就是开源研究和开源的力量

Scale AI CEO Alexandr Wang 直接破防,说 DeepSeek 有50000 台H100,但是由于美国的限制导致他们不能说自己有

Meta的生成AI团队陷入恐慌!从DeepSeek V3横空出世开始,Llama 4的基准测试已被甩在后头,最糟糕的是,竟然有一家“未知的中国公司”投入550万美元的训练预算。这让Meta的工程师们开始疯狂拆解DeepSeek,试图复制它的一切。更让人担忧的是,Meta管理层面临着如何证明生成AI部门巨额开销的问题——毕竟,部门里的每一位“领导者”的薪酬都比训练DeepSeek V3的成本还要高,而且这样的“领导者”有很多。DeepSeek R1的推出更是让情况变得更为严峻。虽然无法透露机密信息,但不久后公众会知晓。原本应该是一个专注于工程的小团队,但由于一群人想借此提升影响力、膨胀招聘规模,最终大家都成了输家

经济学人专栏八卦

还有网友的众多反馈

最后是DeepSeek R1带来的福利

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

求赞

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这才是宋美龄和继子蒋经国的一张真实合影,都是真人的容貌

这才是宋美龄和继子蒋经国的一张真实合影,都是真人的容貌

喜欢历史的阿繁
2026-04-16 11:17:28
阿圭罗:内马尔如果再次跟梅西和苏亚雷斯当队友,会很有趣!

阿圭罗:内马尔如果再次跟梅西和苏亚雷斯当队友,会很有趣!

历史第一人梅西
2026-04-19 19:20:42
斯诺克战报!4强专业户轰7-2,肖国栋德比逆转,张安达爆冷名将?

斯诺克战报!4强专业户轰7-2,肖国栋德比逆转,张安达爆冷名将?

刘姚尧的文字城堡
2026-04-19 07:55:54
贬低全红婵、移居国外、儿子入英国籍?白岩松到底动了谁的蛋糕

贬低全红婵、移居国外、儿子入英国籍?白岩松到底动了谁的蛋糕

许三岁
2026-04-18 09:36:18
“天生的坏种,典型的伥鬼”,小学生地铁站一个动作,被全网讨伐

“天生的坏种,典型的伥鬼”,小学生地铁站一个动作,被全网讨伐

妍妍教育日记
2026-04-16 09:10:09
我的妈呀!被刘诗诗旁边的美女惊艳到了,这五官这气质太完美了

我的妈呀!被刘诗诗旁边的美女惊艳到了,这五官这气质太完美了

科学发掘
2026-04-18 12:57:48
马筱梅哭诉婆婆家没房间,68岁张兰一张健身照回击:少卖惨多读书

马筱梅哭诉婆婆家没房间,68岁张兰一张健身照回击:少卖惨多读书

未曾青梅
2026-04-19 22:11:35
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

番外行
2026-04-02 08:37:13
“专科男生古茗8小时”事件,被全网嘲笑:无知的人连装都不会装

“专科男生古茗8小时”事件,被全网嘲笑:无知的人连装都不会装

妍妍教育日记
2026-02-26 20:37:12
悲剧还是发生了!近日,安徽一女子同房后,肚子很疼,黄体破裂!

悲剧还是发生了!近日,安徽一女子同房后,肚子很疼,黄体破裂!

川渝视觉
2026-04-18 21:37:48
拉住跳楼女友5分钟至力竭,仍被判10%责赔8万:司法自由裁量+无限责任令人不寒而栗

拉住跳楼女友5分钟至力竭,仍被判10%责赔8万:司法自由裁量+无限责任令人不寒而栗

少爷写春秋
2026-04-18 22:47:55
男演员千万别整容,同搭朱珠演中年现偶,钟汉良VS霍建华差别明显

男演员千万别整容,同搭朱珠演中年现偶,钟汉良VS霍建华差别明显

娱君坠星河
2026-04-17 21:40:06
伊朗方面称只要存在海上封锁就不会谈判

伊朗方面称只要存在海上封锁就不会谈判

极目新闻
2026-04-19 22:27:17
国安队刚战平浙江!主力外援就受伤或无法出战下一轮,引发热议

国安队刚战平浙江!主力外援就受伤或无法出战下一轮,引发热议

懂个球
2026-04-20 00:17:12
41岁男子威胁女邻居发生关系,事后女子为自证清白,让他再来一次

41岁男子威胁女邻居发生关系,事后女子为自证清白,让他再来一次

丫头舫
2026-04-10 21:54:02
心理学上说:下等的自愈,是买醉;中等的自愈,是旅行;顶级的自愈,是在琐碎的日子里,学会与自己握手言和

心理学上说:下等的自愈,是买醉;中等的自愈,是旅行;顶级的自愈,是在琐碎的日子里,学会与自己握手言和

四行书
2026-03-17 12:32:38
社保迎来第六险!缴费标准公布

社保迎来第六险!缴费标准公布

新浪财经
2026-04-18 22:37:58
不会干,你就别干了!中国勒令马士基停运,巴拿马的反应很有意思

不会干,你就别干了!中国勒令马士基停运,巴拿马的反应很有意思

青桅
2026-04-19 05:09:38
艾滋病剧增!医生提醒:出门牢记9不碰,别让无知毁了一生!

艾滋病剧增!医生提醒:出门牢记9不碰,别让无知毁了一生!

健康科普365
2026-04-18 19:00:03
男演员千万别整容!钟汉良新剧里的男四号,脸颊歪的真让人出戏

男演员千万别整容!钟汉良新剧里的男四号,脸颊歪的真让人出戏

往史过眼云烟
2026-04-16 14:43:01
2026-04-20 03:31:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1036文章数 397关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

何润东涨粉百万!内娱隔空掀桌第一人

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

数码
游戏
亲子
时尚
军事航空

数码要闻

华为新机发布前瞻:阔折叠X Max+影像旗舰Pura 90,都没悬念了

如何将ZH-1火力最大化?《战舰世界》15.3版本造船厂加点攻略

亲子要闻

孩子总打喷嚏、起疹子,时过敏吗?

装修“精神角落”,就是这么上瘾

军事要闻

伊朗逼退美扫雷艇:美方求给15分钟撤退

无障碍浏览 进入关怀版