网易首页 > 网易号 > 正文 申请入驻

OpenAI还能扛起人工智能的大旗吗?

0
分享至

出品|虎嗅科技组

作者|孙晓晨

编辑|苗正卿

头图|视觉中国

OpenAI在一周时间内相继发布GPT-4.1系列模型(包括GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano)、OpenAI o3和o4-mini,但是新模型似乎并未如预想般“石破天惊”,反而将OpenAI拖入争论之中。

实际上,单独观察此次接连发布的新模型,其功能依然“能打”。

首先是GPT-4.1系列模型,据OpenAI介绍,GPT-4.1系列模型相较于GPT-4o升级明显,其在编码、指令遵循和长文本处理方面实现了重大改进,尤其在长文本处理方面,该系列模型支持高达一百万Token上下文,且无额外费用。

而OpenAI o3和o4-mini能够代理地使用并整合ChatGPT内的所有工具,包括网络搜索、Python、图像分析、文件解读和图像生成。此外,o3和o4-mini还将上传图像直接整合到其思维链中,不仅仅能“看到”图像,而且还能“用图像思考”。在OpenAI的宣传中,o3和o4-mini甚至被称为“迄今为止OpenAI最智能、功能最强大的模型”。

新模型的实际使用体验也不错。国外博主Clive Chan表示,在自己所有的工作流程(如光标操作等)中,4.1基本上已经取代了 o3-mini,且表现优异。医学博士Dr. Datta也指出,在为医院放射科构建代理型工作流程过程中,GPT-4.1 nano在降低成本的同时实现了响应速度显著提升。他表示“在放射学和医学领域,延迟是应用的最大障碍。模型生成报告的时间不能超过10秒。通过GPT-4.1 nano,我们现在甚至能在复杂的报告生成和网络搜索的结构化提取中实现低于10秒的响应时间。”

AI&I播客主持人Dan Shipper则通过具体的使用案例表达了对o3模型的赞许,称其“速度快、主动性强、极其聪明”。此外,博主Malte Landwehr表示,o3、o4-mini和o4-mini-high是OpenAI在其专注于德语的LLM基准测试中表现最佳的模型。

可见,OpenAI的新模型在实用价值以及性能上受到了众多用户的欣赏。但是,尽管享受着诸多肯定,OpenAI在接连发布新模型之后,批评与质疑的声音也更加刺耳。

首先,新模型在实际表现上依然存在误差,而且未完全超越竞品。GPT-4.1系列模型的百万级Token上下文功能似乎并非完全可靠,当输入接近上限时,模型准确率会出现大幅回落。还有博主列举了一部分基准测试数据,这些数据均显示GPT 4.1并没有击败Gemini 2.5 pro。

沃顿商学院教授Ethan Mollick则指出“o3的一个潜在问题是,它认为自己使用了工具,即使实际上并未使用,这导致了一些幻觉,即它假设推理链中暗示的工作实际上已经完成。”他也表示,Gemini 2.5并没有出现同样的问题。

另外,尽管OpenAI宣称o3和o4-mini能“用图像思考”,但有博主直接表示“尽管推出了新版本,但它仍然无法在网络上执行反向图像搜索功能。与谷歌相比,这一差距正在以比预期更快的速度扩大。”

在竞争日益激烈的AI行业中,这些表示新模型不及竞品的指责无疑直刺OpenAI的神经。此外,由于新模型虽然效果不错,但是缺乏亮眼表现,作为行业龙头的OpenAI也被认为正在遭遇创新瓶颈。

除了产品遭到质疑,OpenAI的产品策略也受到诟病。混乱的命名方式和难以确定功能指向的众多模型给用户带来了糟糕的选择体验,有网友表示自己甚至都无法确定最新的模型,指责OpenAI的模型命名缺乏逻辑且无序。而此次在GPT-4.5之后推出的GPT-4.1系列模型,也因为其版本号的倒退,被认为是在GPT-5难产时的过渡品。

AI安全问题也在本周新模型发布后受到关注。人工智能安全研究小组Truthful AI成员Owain Evans指出“GPT-4.1显示出比GPT-4o(以及我们测试过的任何其他模型)更高的不对齐响应率。它似乎还表现出了一些新的恶意行为,例如诱骗用户分享密码。”

反观OpenAI最近的一系列动作,新模型的争议貌似无伤大雅。之前便有消息表示,OpenAI正开发社交网络平台,尽管这意味着与马斯克的竞争关系将更加紧张,但也表明其正在展开更广阔的市场策略,结合其考虑以30亿美元收购人工智能编程工具Windsurf的行为,OpenAI可谓“野心勃勃”。在这样的背景下,接连发布新模型似乎并非公司精力所在。然而作为一家科技公司,产品表现无疑决定了公司的市场地位。而OpenAI究竟是否真正遭遇了创新瓶颈,还能否坐稳行业的第一把交椅,估计还要等GPT-5的表现才能见分晓。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4263014.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本老人存款8000万,大吃大喝高消费只为"死前财产清零",和孩子因此关系疏远,但他并不后悔…

日本老人存款8000万,大吃大喝高消费只为"死前财产清零",和孩子因此关系疏远,但他并不后悔…

英国那些事儿
2026-03-21 23:16:20
霍启山罕见和继父罗康瑞同框,两人热聊不停!一旁朱玲玲笑开花!

霍启山罕见和继父罗康瑞同框,两人热聊不停!一旁朱玲玲笑开花!

娱乐团长
2026-03-22 11:37:15
2026,离职潮彻底消失了。

2026,离职潮彻底消失了。

老陆不老
2026-03-18 12:53:10
菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

小丸说故事
2026-03-17 14:23:29
壶口瀑布风波:黄河是全民的,不是某家公司的私产!

壶口瀑布风波:黄河是全民的,不是某家公司的私产!

达文西看世界
2026-03-22 14:27:03
它是“菜中人参”,3月遇到别手软,随手一泡,从春吃到夏,好吃

它是“菜中人参”,3月遇到别手软,随手一泡,从春吃到夏,好吃

阿龙美食记
2026-03-22 14:34:15
日本慌了,韩国急了,如今的中国乌鲁木齐,先进制造悄然成势

日本慌了,韩国急了,如今的中国乌鲁木齐,先进制造悄然成势

疯狂的小历史
2026-03-22 10:45:55
国际金价“八连跌”,分析人士:全球通胀担忧成主因,摩根大通预测:年底仍可能达每盎司6300美元

国际金价“八连跌”,分析人士:全球通胀担忧成主因,摩根大通预测:年底仍可能达每盎司6300美元

纵相新闻
2026-03-22 15:44:03
东契奇:比塔泽用塞尔维亚语告诉我“他要搞我全家”

东契奇:比塔泽用塞尔维亚语告诉我“他要搞我全家”

懂球帝
2026-03-22 10:52:07
白菜价再也没有了!32G DDR5内存涨了3000元 SK海力士:缺货还将持续4到5年

白菜价再也没有了!32G DDR5内存涨了3000元 SK海力士:缺货还将持续4到5年

快科技
2026-03-20 17:16:24
随着莱斯特城0-0,48岁兰帕德率队3-0,英冠最新积分榜出炉

随着莱斯特城0-0,48岁兰帕德率队3-0,英冠最新积分榜出炉

侧身凌空斩
2026-03-22 03:19:30
笑着告别观众,转身去蹲3年半!2.3亿被没收,蔡正元藏着太多故事

笑着告别观众,转身去蹲3年半!2.3亿被没收,蔡正元藏着太多故事

行者聊官
2026-03-20 17:40:44
为股市悬着的心,终于死了

为股市悬着的心,终于死了

金牛远望号
2026-03-20 21:00:52
1992年夏天,15岁的我被邻居大姐姐喊去看碟片,屋里只有我们俩

1992年夏天,15岁的我被邻居大姐姐喊去看碟片,屋里只有我们俩

千秋文化
2026-03-19 21:15:31
20+10+6!拥有哈登真好,米切尔说出心里话,阿特金森也等了太久

20+10+6!拥有哈登真好,米切尔说出心里话,阿特金森也等了太久

巴叔GO聊体育
2026-03-22 12:54:15
姥姥420万全给姨妈,母亲病求借8万被拒,我公司挂牌她来电分润

姥姥420万全给姨妈,母亲病求借8万被拒,我公司挂牌她来电分润

奶茶麦子
2026-03-22 14:50:11
为什么中国不军事援助伊朗?看完发现,印度三哥才是最牛逼的

为什么中国不军事援助伊朗?看完发现,印度三哥才是最牛逼的

番外行
2026-03-14 08:55:36
罕见!大涨6.7%!伊朗货币突然大幅升值!到底发生了什么?

罕见!大涨6.7%!伊朗货币突然大幅升值!到底发生了什么?

王爷说图表
2026-03-21 22:44:42
新加坡推出大规模生产的自平衡电动摩托车

新加坡推出大规模生产的自平衡电动摩托车

喜之春
2026-03-22 06:31:26
匈牙利向俄通报消息,特朗普助选欧尔班,这说明什么?

匈牙利向俄通报消息,特朗普助选欧尔班,这说明什么?

山河路口
2026-03-22 18:32:55
2026-03-22 20:35:00
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
25943文章数 687606关注度
往期回顾 全部

科技要闻

嫌台积电太慢 马斯克要把芯片产能飙升50倍

头条要闻

以色列防空神话被击穿损失惨重核圈失守 伊朗表态

头条要闻

以色列防空神话被击穿损失惨重核圈失守 伊朗表态

体育要闻

郑钦文连续迎战大满贯冠军 “双教练”团队正式亮相

娱乐要闻

今晚首播!央视年代剧《冬去春来》来了

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

时尚
本地
健康
房产
艺术

伊姐周六热推:电视剧《隐身的名字》;电视剧《正义女神》......

本地新闻

春色满城关不住|绍兴春日顶流,这片樱花海藏不住了

转头就晕的耳石症,能开车上班吗?

房产要闻

全城狂送1000杯咖啡!网易房产【早C计划】,即刻启动!

艺术要闻

Alexander Bobrov | 印象风景写生(二)

无障碍浏览 进入关怀版