网易首页 > 网易号 > 正文 申请入驻

OpenAI还能扛起人工智能的大旗吗?

0
分享至

出品|虎嗅科技组

作者|孙晓晨

编辑|苗正卿

头图|视觉中国

OpenAI在一周时间内相继发布GPT-4.1系列模型(包括GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano)、OpenAI o3和o4-mini,但是新模型似乎并未如预想般“石破天惊”,反而将OpenAI拖入争论之中。

实际上,单独观察此次接连发布的新模型,其功能依然“能打”。

首先是GPT-4.1系列模型,据OpenAI介绍,GPT-4.1系列模型相较于GPT-4o升级明显,其在编码、指令遵循和长文本处理方面实现了重大改进,尤其在长文本处理方面,该系列模型支持高达一百万Token上下文,且无额外费用。

而OpenAI o3和o4-mini能够代理地使用并整合ChatGPT内的所有工具,包括网络搜索、Python、图像分析、文件解读和图像生成。此外,o3和o4-mini还将上传图像直接整合到其思维链中,不仅仅能“看到”图像,而且还能“用图像思考”。在OpenAI的宣传中,o3和o4-mini甚至被称为“迄今为止OpenAI最智能、功能最强大的模型”。

新模型的实际使用体验也不错。国外博主Clive Chan表示,在自己所有的工作流程(如光标操作等)中,4.1基本上已经取代了 o3-mini,且表现优异。医学博士Dr. Datta也指出,在为医院放射科构建代理型工作流程过程中,GPT-4.1 nano在降低成本的同时实现了响应速度显著提升。他表示“在放射学和医学领域,延迟是应用的最大障碍。模型生成报告的时间不能超过10秒。通过GPT-4.1 nano,我们现在甚至能在复杂的报告生成和网络搜索的结构化提取中实现低于10秒的响应时间。”

AI&I播客主持人Dan Shipper则通过具体的使用案例表达了对o3模型的赞许,称其“速度快、主动性强、极其聪明”。此外,博主Malte Landwehr表示,o3、o4-mini和o4-mini-high是OpenAI在其专注于德语的LLM基准测试中表现最佳的模型。

可见,OpenAI的新模型在实用价值以及性能上受到了众多用户的欣赏。但是,尽管享受着诸多肯定,OpenAI在接连发布新模型之后,批评与质疑的声音也更加刺耳。

首先,新模型在实际表现上依然存在误差,而且未完全超越竞品。GPT-4.1系列模型的百万级Token上下文功能似乎并非完全可靠,当输入接近上限时,模型准确率会出现大幅回落。还有博主列举了一部分基准测试数据,这些数据均显示GPT 4.1并没有击败Gemini 2.5 pro。

沃顿商学院教授Ethan Mollick则指出“o3的一个潜在问题是,它认为自己使用了工具,即使实际上并未使用,这导致了一些幻觉,即它假设推理链中暗示的工作实际上已经完成。”他也表示,Gemini 2.5并没有出现同样的问题。

另外,尽管OpenAI宣称o3和o4-mini能“用图像思考”,但有博主直接表示“尽管推出了新版本,但它仍然无法在网络上执行反向图像搜索功能。与谷歌相比,这一差距正在以比预期更快的速度扩大。”

在竞争日益激烈的AI行业中,这些表示新模型不及竞品的指责无疑直刺OpenAI的神经。此外,由于新模型虽然效果不错,但是缺乏亮眼表现,作为行业龙头的OpenAI也被认为正在遭遇创新瓶颈。

除了产品遭到质疑,OpenAI的产品策略也受到诟病。混乱的命名方式和难以确定功能指向的众多模型给用户带来了糟糕的选择体验,有网友表示自己甚至都无法确定最新的模型,指责OpenAI的模型命名缺乏逻辑且无序。而此次在GPT-4.5之后推出的GPT-4.1系列模型,也因为其版本号的倒退,被认为是在GPT-5难产时的过渡品。

AI安全问题也在本周新模型发布后受到关注。人工智能安全研究小组Truthful AI成员Owain Evans指出“GPT-4.1显示出比GPT-4o(以及我们测试过的任何其他模型)更高的不对齐响应率。它似乎还表现出了一些新的恶意行为,例如诱骗用户分享密码。”

反观OpenAI最近的一系列动作,新模型的争议貌似无伤大雅。之前便有消息表示,OpenAI正开发社交网络平台,尽管这意味着与马斯克的竞争关系将更加紧张,但也表明其正在展开更广阔的市场策略,结合其考虑以30亿美元收购人工智能编程工具Windsurf的行为,OpenAI可谓“野心勃勃”。在这样的背景下,接连发布新模型似乎并非公司精力所在。然而作为一家科技公司,产品表现无疑决定了公司的市场地位。而OpenAI究竟是否真正遭遇了创新瓶颈,还能否坐稳行业的第一把交椅,估计还要等GPT-5的表现才能见分晓。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4263014.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
事关事业退休金:国人部发〔2006〕60号核心要点梳理

事关事业退休金:国人部发〔2006〕60号核心要点梳理

金哥说新能源车
2026-06-28 19:04:40
“一台电脑获取8次平台补贴款”,有人篡改商品SN码套取平台补贴,涉案金额超2700万元,上海警方:成功抓获2个犯罪团伙

“一台电脑获取8次平台补贴款”,有人篡改商品SN码套取平台补贴,涉案金额超2700万元,上海警方:成功抓获2个犯罪团伙

扬子晚报
2026-06-28 20:48:50
妻子嫌我没出息出轨离了婚,半年后她被甩回来找我,我说:我嫌脏

妻子嫌我没出息出轨离了婚,半年后她被甩回来找我,我说:我嫌脏

千秋文化
2026-06-21 19:59:05
1亿中锋仅要1个首轮!交易市场最超值的大鱼出现,湖人等多队哄抢

1亿中锋仅要1个首轮!交易市场最超值的大鱼出现,湖人等多队哄抢

你的篮球频道
2026-06-28 11:57:08
蒯曼半年换三帅:离开邱贻可,“天才少女”怎么就不会打球了?

蒯曼半年换三帅:离开邱贻可,“天才少女”怎么就不会打球了?

神颜贩卖机
2026-06-28 22:01:14
94岁原中央保健局局长王敏清:50年没感冒,无三高,靠的就是这几招

94岁原中央保健局局长王敏清:50年没感冒,无三高,靠的就是这几招

新浪财经
2026-06-24 02:28:33
男子网购 “乖乖水”等掺入多名女性饮品中,迷昏对方后实施猥亵并拍视频传播,案发后男子家属代为赔偿受害人损失并取得谅解,男子被判5年

男子网购 “乖乖水”等掺入多名女性饮品中,迷昏对方后实施猥亵并拍视频传播,案发后男子家属代为赔偿受害人损失并取得谅解,男子被判5年

扬子晚报
2026-06-28 13:45:16
刚出炉!东莞人口暴涨!

刚出炉!东莞人口暴涨!

东莞好生活
2026-06-28 15:44:00
离谱!3亿身家、14任鲜肉、5万人报名、一天28次,泰国富婆太荒诞

离谱!3亿身家、14任鲜肉、5万人报名、一天28次,泰国富婆太荒诞

阿讯说天下
2026-06-26 12:08:56
养老金上调敲定,哪几类人涨幅更高?一文看懂

养老金上调敲定,哪几类人涨幅更高?一文看懂

职场资深秘书
2026-06-28 21:19:25
安徽淮南“黑医师速成班”被查封,老板及骨干被刑拘!民警回应:记者暗访取证的资料起到重要作用

安徽淮南“黑医师速成班”被查封,老板及骨干被刑拘!民警回应:记者暗访取证的资料起到重要作用

封面新闻
2026-06-28 00:34:22
为什么今年没人提“消费降级”了?

为什么今年没人提“消费降级”了?

黯泉
2026-05-20 17:47:21
看2026北京高考平均分前60名学校排名,对中考报考也许有用!

看2026北京高考平均分前60名学校排名,对中考报考也许有用!

一口娱乐
2026-06-28 13:39:14
李连杰一家三口拜见仁波切,64岁利智许久不见,颜值回春如昔日!

李连杰一家三口拜见仁波切,64岁利智许久不见,颜值回春如昔日!

娱乐团长
2026-06-02 15:09:12
中央5台直播世界杯时间表:明天6月29日CCTV5直播,加拿大PK南非

中央5台直播世界杯时间表:明天6月29日CCTV5直播,加拿大PK南非

薇说体育
2026-06-28 15:41:01
原来好老公都是抢来的!网友:好男人根本不流通

原来好老公都是抢来的!网友:好男人根本不流通

康富贵碎碎念
2026-06-28 15:36:21
白玉兰名场面:闫妮宣布最佳男主,全场笑疯了

白玉兰名场面:闫妮宣布最佳男主,全场笑疯了

可乐谈情感
2026-06-28 18:43:34
大我15岁女老板晚上留我独自加班,锁上门后她说:今晚找你有个事

大我15岁女老板晚上留我独自加班,锁上门后她说:今晚找你有个事

千秋文化
2026-06-19 20:14:12
日元汇率暴跌开始,等10年后,我们可能想抵制日货都抵制不了了

日元汇率暴跌开始,等10年后,我们可能想抵制日货都抵制不了了

潋滟晴方DAY
2026-06-28 12:55:28
2026-06-28 23:20:49
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
26553文章数 687841关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

养老院取名"如家" 没被如家酒店投诉反被一女子投诉

头条要闻

养老院取名"如家" 没被如家酒店投诉反被一女子投诉

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

房产
旅游
家居
教育
健康

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

旅游要闻

以古籍为“导游”,潍坊市图书馆让市民化身城市文旅体验官

家居要闻

绿意盎然 自然之境

教育要闻

明日提前批第1次志愿填报!注意事项来啦↘

“无糖汤圆”是否隐藏着健康陷阱?

无障碍浏览 进入关怀版