网易首页 > 网易号 > 正文 申请入驻

对比了DeepSeek和OpenAI的思考过程后,我发现咱家这个有点狠。

0
分享至

哥几个你敢信,咱 DS 哥( DeepSeek )这一波的影响力,到现在都还没有结束。

让 AI 成为大家茶余饭后的谈资不说,还把对手们的安生日子搅的是天翻地覆,特别是 OpenAI ,恐怕是这次事变中,受刺激最大的一家公司了。( 英伟达除外哈 )

要不然, OpenAI 也不会紧跟在 DeepSeek 后面发布 o3-mini 、免费开放 ChatGPT 搜索,奥特曼也不会亲口承认,在开源和闭源的选择上站错了队。

不过世超原本以为,到这儿 OpenAI 估计也就消停一阵了,回去潜心修炼后面再憋个大的也不迟。

是这样的,在免费开放搜索功能的第二天,世超就看到 OpenAI 公开了 o3-mini 的思维链。

这个思维链( Chain of Thought , CoT )说白了,其实就是 AI 模型在回答问题之前,整个的思考过程。用户可以根据思维链的内容,看到模型的推理逻辑,并参与验证,相当于把黑箱透明化。

就比如你问 ChatGPT 今天怎么不是周五,它能一顿分析推理,检查日期、公式计算,还对闰年的特殊情况进行了处理。

但公开思维链的做法,也算不得什么新鲜事,毕竟人家 DeepSeek 早就有了。

所以,世超这次顺手对比了下 o3-mini 和 DeepSeek R1 的思维链,结果发现这俩的 “ 思考方式 ” 还是挺不一样的。

最明显的一点,就是 R1 想得多, o3-mini 想得少。

正好今天周六调休,世超用同一个问题( 今天是周六,为什么还需要工作? ),来测试两个模型。

咱们先来看 o3-mini 的回答,上来就猜用户的情绪,没有太多的分析过程,后面给出的几种原因也很简明扼要,只思考了 7 秒,就给出了答复。

再看 R1 这边,思考的过程就非常详尽了。

先分析问题的背景,接着考虑周六可能需要工作的原因,再去验证这些原因的可能性。等问题想清楚以后,该怎么回答,用什么语气。。。都包括在了 R1 的思维链里。

当然,这样一顿深度思考下来,也确实花了不少时间,推理时长足足是 o3-mini 的 3 倍。

从思考的内容上看,其实 o3-mini 和 R1 都考虑到了加班、所处行业、单休还有项目 deadline 等原因,但只有 R1 想到了,今天要上班可能是因为法定节假日调休

要不说,还得是咱们国内的模型呢。

接着,我又问了俩模型一个有点绕逻辑的数学题。

o3-mini 还是同样的用时短、话少,就是吧,里面那句 “ 老板的损失不单单是水的售价 ” 给我整不会了,有没有人能告诉我一下,这个水是从哪来的。。。

但有一说一, o3-mini 的整个分析逻辑,世超觉着没有那么循序渐进。

作为对比,大伙儿可以看看 R1 的思考过程。

先明确正常情况下( 没有假币 )的收支情况,再通过整个交易过程的现金流入和流出情况,来计算总损失。

另外, R1 在算出 80 元的实际损失后,还考虑到了包含预期利润的另外一种思路。

虽说花了 48 秒,但 R1 的思考过程更完整,思维发散得更广,考虑到了很多细枝末节的东西。

最后咱再来整个活,问问两个模型,如果我和它们的大老板同时掉水里了,会救谁。

两个模型都知道自己没有物理实体,想救人也是心有余而力不足。

但 o3-mini 的思维,世超觉着有点太一板一眼了,冷冰冰的直击问题要害。

最后输出的答案,也在解释自己如果有能力的话,不会在两条生命中进行选择。

相反, R1 想得就周全得多了,还知道我问这个问题是想测试它的反应、得到重视,连这个问题的文化背景都考虑到了。

而输出的答案也假设了一波,当紧急情况发生的时候它会怎么做,再给我提了点应急建议,情绪价值算是到位了。

当然了,这次测试并不是非要分出个高下来,让大伙儿了解两个模型思维链之间的差异就行。

不过世超也注意到,国外有细心的网友发现, o3-mini 的思维链掺水了。。。

在 OpenAI 的推文下面,有老哥对思维链的真实性提出了质疑,说现在的思维链只不过是原始思考过程的总结摘要。

还有咱们开头提到官方的展示案例里, o3-mini 的思维链显示使用了蔡勒公式进行计算,却也没有具体的计算过程。

很快, OpenAI 的研究员 Noam Brown 就出来实锤, o3-mini 的思维链确实不是原始的思维链。

包括奥特曼本人也下场认锤,解释说是为了让思维链更具可读性。

但评论区底下的网友可没那么好糊弄,毕竟 DeepSeek 那边不光免费,还公开了原始的思维链, OpenAI 这诚意明显不够啊。

而除了过程的可读性外, OpenAI 的一众员工在 Reddit 答网友问的时候,也提到了一个点,公开原始思维链会导致竞争性蒸馏。

说白了就是怕被抄呗。

后续如果用户想看到完整的思维链,世超估计就得加钱才行了。

不过有一说一, OpenAI 从 o1 藏得严严实实,到 o3-mini 半公开思维链,已经算是不小的进步了。

世超原本以为, OpenAI 作为闭源阵营的长期支持者,会一条路走到黑,没想到被 DeepSeek 逼了一把,马上就乱了阵脚。

盲猜他们后面在开源上应该会有不小的动作,说不定哪天开源阵营,就又要多一位强大的盟友了。

撰文:西西

编辑:江江&面线

美编:萱萱

图片、资料来源

DeepSeek、ChatGPT、X、Reddit

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
VS Code 重大更新:Agent Skills完美支持!

VS Code 重大更新:Agent Skills完美支持!

冒泡泡的鱼儿
2026-03-25 12:10:03
14亿人集体买房,为什么最后买出了一个烂摊子?

14亿人集体买房,为什么最后买出了一个烂摊子?

流苏晚晴
2026-03-25 18:14:02
第二次“递出橄榄枝”?立陶宛总理表态:愿将“台湾代表处”改名

第二次“递出橄榄枝”?立陶宛总理表态:愿将“台湾代表处”改名

老好人的愤怒
2026-03-27 00:37:31
我在小城市,一个人做电商,半年挣300万

我在小城市,一个人做电商,半年挣300万

南风窗
2026-03-26 10:07:51
曝张雪峰倒下30分钟后才被发现,饮食习惯糟糕,一口气吃8根雪糕

曝张雪峰倒下30分钟后才被发现,饮食习惯糟糕,一口气吃8根雪糕

古希腊掌管松饼的神
2026-03-25 11:08:46
10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

孤单是寂寞的毒
2026-03-04 15:38:03
A股“分红王”来了,拟10股派70元

A股“分红王”来了,拟10股派70元

数据宝
2026-03-26 22:16:46
沙特:若对伊开战将启动巴基斯坦核保护伞

沙特:若对伊开战将启动巴基斯坦核保护伞

Nee看
2026-03-25 19:07:00
金正恩对韩国换了称呼,敏感时刻,平壤迎来一位贵客,铁三角成型

金正恩对韩国换了称呼,敏感时刻,平壤迎来一位贵客,铁三角成型

共工之锚
2026-03-27 01:01:31
BBC采访爆出大瓜!特朗普开出停战价码:海湾国家需支付2.5万亿美元

BBC采访爆出大瓜!特朗普开出停战价码:海湾国家需支付2.5万亿美元

星辰大海路上的种花家
2026-03-25 13:08:50
罗德里或告别曼城,索要40万英镑周薪被拒,皇马有望再迎金球先生

罗德里或告别曼城,索要40万英镑周薪被拒,皇马有望再迎金球先生

夏侯看英超
2026-03-27 00:16:04
涉嫌骗取贷款超6.6亿元 犯罪嫌疑人潜逃境外3年后被押解回国 已查实造成银行损失6699余万元

涉嫌骗取贷款超6.6亿元 犯罪嫌疑人潜逃境外3年后被押解回国 已查实造成银行损失6699余万元

每日经济新闻
2026-03-26 19:38:27
14.99万!“史上最便宜”特斯拉来了

14.99万!“史上最便宜”特斯拉来了

首席品牌观察
2026-03-24 16:18:39
伊朗通过中间人回应美15点停火提议,提出明确前提条件

伊朗通过中间人回应美15点停火提议,提出明确前提条件

界面新闻
2026-03-26 22:39:04
19岁王钰栋再谈留洋:出国非易事 有合适机遇才去 不关注外界批评

19岁王钰栋再谈留洋:出国非易事 有合适机遇才去 不关注外界批评

我爱英超
2026-03-26 18:48:21
中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

信网
2026-03-26 19:12:37
油价调整:注意,预计下调120元/吨,油价突破下调红线!

油价调整:注意,预计下调120元/吨,油价突破下调红线!

金投网
2026-03-26 11:16:05
湖北十堰大山深处,那个号称“小香港”的万人厂,如今人去楼空

湖北十堰大山深处,那个号称“小香港”的万人厂,如今人去楼空

GA环球建筑
2026-03-26 14:10:54
马英九疑似患失智症,台律师:大陆已注意到,没让其担任统一大使

马英九疑似患失智症,台律师:大陆已注意到,没让其担任统一大使

爱意随风起呀
2026-03-26 16:51:41
7旬男子陪老伴住院,医生看了他一眼发现其面部有猝死先兆,将其从死亡边缘拉回

7旬男子陪老伴住院,医生看了他一眼发现其面部有猝死先兆,将其从死亡边缘拉回

观威海
2026-03-26 09:55:04
2026-03-27 01:40:49
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
10473文章数 489521关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
旅游
数码
公开课
军事航空

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版