网易首页 > 网易号 > 正文 申请入驻

OpenAI还能扛起人工智能的大旗吗?

0
分享至


出品|虎嗅科技组

作者|孙晓晨

编辑|苗正卿

头图|视觉中国

OpenAI在一周时间内相继发布GPT-4.1系列模型(包括GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano)、OpenAI o3和o4-mini,但是新模型似乎并未如预想般“石破天惊”,反而将OpenAI拖入争论之中。

实际上,单独观察此次接连发布的新模型,其功能依然“能打”。

首先是GPT-4.1系列模型,据OpenAI介绍,GPT-4.1系列模型相较于GPT-4o升级明显,其在编码、指令遵循和长文本处理方面实现了重大改进,尤其在长文本处理方面,该系列模型支持高达一百万Token上下文,且无额外费用。


而OpenAI o3和o4-mini能够代理地使用并整合ChatGPT内的所有工具,包括网络搜索、Python、图像分析、文件解读和图像生成。此外,o3和o4-mini还将上传图像直接整合到其思维链中,不仅仅能“看到”图像,而且还能“用图像思考”。在OpenAI的宣传中,o3和o4-mini甚至被称为“迄今为止OpenAI最智能、功能最强大的模型”。


新模型的实际使用体验也不错。国外博主Clive Chan表示,在自己所有的工作流程(如光标操作等)中,4.1基本上已经取代了 o3-mini,且表现优异。医学博士Dr. Datta也指出,在为医院放射科构建代理型工作流程过程中,GPT-4.1 nano在降低成本的同时实现了响应速度显著提升。他表示“在放射学和医学领域,延迟是应用的最大障碍。模型生成报告的时间不能超过10秒。通过GPT-4.1 nano,我们现在甚至能在复杂的报告生成和网络搜索的结构化提取中实现低于10秒的响应时间。”


AI&I播客主持人Dan Shipper则通过具体的使用案例表达了对o3模型的赞许,称其“速度快、主动性强、极其聪明”。此外,博主Malte Landwehr表示,o3、o4-mini和o4-mini-high是OpenAI在其专注于德语的LLM基准测试中表现最佳的模型。



可见,OpenAI的新模型在实用价值以及性能上受到了众多用户的欣赏。但是,尽管享受着诸多肯定,OpenAI在接连发布新模型之后,批评与质疑的声音也更加刺耳。

首先,新模型在实际表现上依然存在误差,而且未完全超越竞品。GPT-4.1系列模型的百万级Token上下文功能似乎并非完全可靠,当输入接近上限时,模型准确率会出现大幅回落。还有博主列举了一部分基准测试数据,这些数据均显示GPT 4.1并没有击败Gemini 2.5 pro。


沃顿商学院教授Ethan Mollick则指出“o3的一个潜在问题是,它认为自己使用了工具,即使实际上并未使用,这导致了一些幻觉,即它假设推理链中暗示的工作实际上已经完成。”他也表示,Gemini 2.5并没有出现同样的问题。


另外,尽管OpenAI宣称o3和o4-mini能“用图像思考”,但有博主直接表示“尽管推出了新版本,但它仍然无法在网络上执行反向图像搜索功能。与谷歌相比,这一差距正在以比预期更快的速度扩大。”


在竞争日益激烈的AI行业中,这些表示新模型不及竞品的指责无疑直刺OpenAI的神经。此外,由于新模型虽然效果不错,但是缺乏亮眼表现,作为行业龙头的OpenAI也被认为正在遭遇创新瓶颈。

除了产品遭到质疑,OpenAI的产品策略也受到诟病。混乱的命名方式和难以确定功能指向的众多模型给用户带来了糟糕的选择体验,有网友表示自己甚至都无法确定最新的模型,指责OpenAI的模型命名缺乏逻辑且无序。而此次在GPT-4.5之后推出的GPT-4.1系列模型,也因为其版本号的倒退,被认为是在GPT-5难产时的过渡品。

AI安全问题也在本周新模型发布后受到关注。人工智能安全研究小组Truthful AI成员Owain Evans指出“GPT-4.1显示出比GPT-4o(以及我们测试过的任何其他模型)更高的不对齐响应率。它似乎还表现出了一些新的恶意行为,例如诱骗用户分享密码。”


反观OpenAI最近的一系列动作,新模型的争议貌似无伤大雅。之前便有消息表示,OpenAI正开发社交网络平台,尽管这意味着与马斯克的竞争关系将更加紧张,但也表明其正在展开更广阔的市场策略,结合其考虑以30亿美元收购人工智能编程工具Windsurf的行为,OpenAI可谓“野心勃勃”。在这样的背景下,接连发布新模型似乎并非公司精力所在。然而作为一家科技公司,产品表现无疑决定了公司的市场地位。而OpenAI究竟是否真正遭遇了创新瓶颈,还能否坐稳行业的第一把交椅,估计还要等GPT-5的表现才能见分晓。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4263014.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
魏牌全新高山:新家庭时代,如何觅知音?

魏牌全新高山:新家庭时代,如何觅知音?

autocarweekly
2025-05-16 18:15:27
联合国官宣!49 岁刘国梁走马上任,新身份曝光,中国乒协回应

联合国官宣!49 岁刘国梁走马上任,新身份曝光,中国乒协回应

大歪歪
2025-05-16 17:33:15
5月17日俄乌:特朗普猛批泽连斯基,俄罗斯誓言要战斗到底

5月17日俄乌:特朗普猛批泽连斯基,俄罗斯誓言要战斗到底

山河路口
2025-05-17 17:02:26
权大还是法大?广西一民企投资遭当地“晃点”

权大还是法大?广西一民企投资遭当地“晃点”

大象新闻
2025-05-16 20:52:02
杜特尔特盟友在选举中排名靠前,政治分析人士:“看起来,菲律宾当局失败了”

杜特尔特盟友在选举中排名靠前,政治分析人士:“看起来,菲律宾当局失败了”

上观新闻
2025-05-17 15:13:03
好消息!铁路部门出“新规”:60岁以上老人可享受5大“特权”

好消息!铁路部门出“新规”:60岁以上老人可享受5大“特权”

平说财经
2025-05-17 16:13:26
这次特朗普的中东之行告诉全世界:出来混,最终靠的还是实力!

这次特朗普的中东之行告诉全世界:出来混,最终靠的还是实力!

翻开历史和现实
2025-05-17 12:53:32
雅典卫城上空现“巨鞋”形状无人机群 希腊下令彻查

雅典卫城上空现“巨鞋”形状无人机群 希腊下令彻查

国际在线
2025-05-17 06:25:34
高炉国白人男性结婚率只有3%,为什么这么低

高炉国白人男性结婚率只有3%,为什么这么低

鹏程蛇口
2025-05-17 12:49:31
全深圳最慌的,估计就是黄杨钿甜的妈妈了!悔不该送去娱乐圈啊!

全深圳最慌的,估计就是黄杨钿甜的妈妈了!悔不该送去娱乐圈啊!

青青子衿
2025-05-17 01:37:07
广东一美女老师约炮多人,大量私密照流出:被情人顶得腰直不起来

广东一美女老师约炮多人,大量私密照流出:被情人顶得腰直不起来

博士观察
2025-05-17 09:21:51
突然大跌!网友惊呼:亏麻了

突然大跌!网友惊呼:亏麻了

业翔民安
2025-05-17 12:59:12
想不明白,明明国家在贸易战中严控稀土,为什么还会发生多起走私

想不明白,明明国家在贸易战中严控稀土,为什么还会发生多起走私

深析古今
2025-05-17 18:23:20
戴230万耳环的黄杨钿甜父亲,被网友举报到中央巡视工作组了!

戴230万耳环的黄杨钿甜父亲,被网友举报到中央巡视工作组了!

小人物看尽人间百态
2025-05-17 17:14:23
佛山女教师婚内出轨多人,被“弟弟”顶得腰疼,次日勾搭另一男人

佛山女教师婚内出轨多人,被“弟弟”顶得腰疼,次日勾搭另一男人

社会酱
2025-05-16 17:30:43
2-0到2-4,一轮游!国乒世乒赛首败,登上热搜第一,王皓被气黑脸

2-0到2-4,一轮游!国乒世乒赛首败,登上热搜第一,王皓被气黑脸

侃球熊弟
2025-05-17 19:56:28
公安部:恶意传播涉刘国梁不实信息,影响恶劣,杜某川、汤某被处罚

公安部:恶意传播涉刘国梁不实信息,影响恶劣,杜某川、汤某被处罚

新京报政事儿
2025-05-17 15:06:53
日本签证很神奇!无论你发什么照片给他们,都能搞成日本人的感觉

日本签证很神奇!无论你发什么照片给他们,都能搞成日本人的感觉

有趣的火烈鸟
2025-05-17 19:17:05
太惨了!湖南一小车遭两货车夹击,2名女教师身亡!知情者发声

太惨了!湖南一小车遭两货车夹击,2名女教师身亡!知情者发声

小人物看尽人间百态
2025-05-17 13:22:44
国乒大将一轮游!遭日本21岁天才翻盘,男单两大区沦陷,夺冠悬了

国乒大将一轮游!遭日本21岁天才翻盘,男单两大区沦陷,夺冠悬了

嘴炮体坛
2025-05-17 18:38:10
2025-05-17 21:27:00
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
24121文章数 686183关注度
往期回顾 全部

科技要闻

王树国:梁文锋如果读博 还有DeepSeek吗?

头条要闻

俄乌刚谈完 五国领导人又火速"抱团"给特朗普打电话

头条要闻

俄乌刚谈完 五国领导人又火速"抱团"给特朗普打电话

体育要闻

三年过去了,布伦森的打脸还没停

娱乐要闻

汪小菲婚礼在亭子里办仪式好热闹

财经要闻

关键时刻,央妈出手了

汽车要闻

小米汽车回应前保险杠变形 免费取送车和修复

态度原创

教育
艺术
亲子
时尚
军事航空

教育要闻

有变化!某校官宣调整26考研学制!

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

亲子要闻

宝宝呕吐,以为是积食,查体后医生抱进了抢救室!

50岁女人不管差不差钱,运用好这5个搭配的技巧,优雅不过时

军事要闻

央视披露歼-10CE为何能击落多架战机

无障碍浏览 进入关怀版