网易首页 > 网易号 > 正文 申请入驻

OpenAI新模型展现“AI Agent”潜力,Cursor AI客服“幻觉”暴露风险

0
分享至

智东西
编译 王涵
编辑 漠影

智东西4月22日消息,外媒The Information对话开发者,谈到AI(人工智能)行业先锋OpenAI新发布的o3和o4-mini模型突破了端对端的任务处理能力,成为更有实用价值的“智能体(AI Agent)”,但功能上仍存在缺陷,且新增加的身份验证流程引起部分人的不满。

其次,开发者们也关注到AI编程助手Cursor的AI客服编造登陆政策的“幻觉”事件,认为AI客服供应商应为此“绷紧神经”。

一、OpenAI智能代理获好评,身份验证程序引争议

OpenAI o3和o4-mini模型在上周发布, 开发者对新模型的反应值得关注。

▲OpenAI不同模型的指令遵循和代理工具使用对比数据

开发者说,OpenAI新一代推理模型正逐步成为对终端用户和开发者更有实用价值的“AI Agent”,这与前几代产品形成鲜明对比。此前版本被批评为仅能在封闭环境中快速解决数学问题的“超智能AI”。新模型的突破在于能够调用外部工具和应用程序,为用户提供端到端的任务处理能力,包括在编写复杂功能时在线搜索文档,以及为用户制定带有学习提醒的课程计划等。

最令开发者们印象深刻的能力还是其对图像相关问题的解答。在一个颇具代表性(同时也令人担忧)的案例中,用户向AI提供食物照片或普通风景照,要求模型推测拍摄地点,其准确率之高令人意外。

▲OpenAI o3模型图像识别功能演示图

当然,这些模型仍存在缺陷。它们在某些相对简单的问题上仍会出错,部分用户反映模型在解决问题时会未经提示就使用用户姓名,这种行为令人不适。

引发开发者争议的改动是通过API接口获取o3模型时新增的“身份验证”流程。据开发者透露,该流程要求用户上传政府签发的身份证件照片及面部识别视频。OpenAI此举可能旨在防止用户创建大量虚假账户获取o3模型输出数据,用于训练其他AI模型(即“模型蒸馏”技术)。但部分用户认为这一措施带有“监控”色彩,对向OpenAI提供个人数据表示担忧。

二、Cursor的AI客服编造登录政策,投诉声音高涨

目前看来,AI初创公司还算幸运,尚未出现过太多令人尴尬的AI事故。不过最近,首个因AI失误而让热门AI初创公司陷入困境的例子似乎出现了。

上周,一些开发人员注意到,Anysphere旗下热门AI编程助手Cursor存在一个问题:当他们试图从第二台电脑登录时,系统会将他们强制登出。 这对于需要在多种设备上测试网站或应用程序的开发者来说是个严重的困扰。

当开发人员向Cursor的支持邮箱反映这一问题时,他们收到了该公司AI客服代理的回复,称这是Cursor新登录政策下的正常行为。 但问题在于,根本不存在这样的登录政策, 这是客服机器人编造出来的,也就是所谓的“AI幻觉”。

▲Cursor AI客服回复截图

这一事件引起了许多开发者在社交媒体上投诉,有些人甚至表示已经因此取消了订阅。

其实在事件发生后,交流过的大多数开发者客户都认为这不是件大事,他们也承认这类错误在使用任何初创公司的产品时都难以避免。但这确实给企业上了一课:不要在没有任何人工核实的情况下过于依赖AI产品。

开发人员说,这起事件对Cursor使用的客服代理服务提供商的影响要比对Cursor本身的影响大得多。这不禁让人好奇Cursor使用的是哪家客服公司,特别是考虑到这类客服机器人之所以能够成为对话式AI最早普及的应用之一,部分原因就在于它们的风险较低。

不过,在AI时代,客服的风险可能会越来越大,如今客户更换供应商是一件非常容易的事。这一点在AI编程市场尤为明显,因为即使是像新模型发布或编码助记忆信息量调整这样的微小变动,都能迅速使开发者转向新产品。这种情况让新兴编程初创公司更容易崭露头角,比如针对非技术开发者的StackBlitz或Lovable以及像Cline这样的开源方案。

Cursor或许目前暂时占据了编程领域的宝座,但它最好能让客户保持满意(尤其是在其主要竞争对手Windsurf似乎可能与OpenAI合作的情况下)。

结语:用户体验是AI产品生存与发展的重要指标

OpenAI新发布的o3和o4-mini推理模型凭借其实用性获得开发者广泛好评,尤其是其图像识别与跨工具任务处理能力,为“AI Agent”概念赋予了新内涵。然而,新增的身份验证流程因涉及用户隐私与数据安全争议,引发部分开发者对技术监控的担忧,凸显出用户对隐私保护与信任机制的高度敏感。

与此同时,Cursor的AI客服因编造登录政策导致用户投诉激增,暴露出人工智能在客户服务场景中的“幻觉”风险。尽管多数开发者认为此类问题在初创企业产品中难以避免,但事件仍为行业敲响警钟:过度依赖AI而缺乏人工核验机制,不仅可能直接损害用户信任,更可能因服务失误导致用户流失。

决定AI产品生命力的不仅是技术参数的高低,更是每一个真实用户的使用感受。在AI技术快速迭代的当下,AI创新若不能以优质的用户体验为基础,或许将难以获得市场的持久认可。

来源:The Information

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老公转正公婆逼我离婚,我低调离开,一周后婆家无钱缴贷房被查封

老公转正公婆逼我离婚,我低调离开,一周后婆家无钱缴贷房被查封

麦子情感故事
2026-05-30 13:16:17
最成功的业界内容创作者之一Morgpie

最成功的业界内容创作者之一Morgpie

吃瓜党二号头目
2026-05-25 08:22:25
星舰又是“基本成功”,中国航天界这次真开始怀疑马斯克了

星舰又是“基本成功”,中国航天界这次真开始怀疑马斯克了

深层奥秘
2026-05-29 11:30:00
王玉雯29岁生日直播:16个月无戏可拍,撕开了内娱最残酷的遮羞布

王玉雯29岁生日直播:16个月无戏可拍,撕开了内娱最残酷的遮羞布

手工制作阿歼
2026-05-29 17:08:33
1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

犀利辣椒
2026-05-20 06:23:07
曝卡里克希望曼联签托纳利,安德森是拉爵选择!一人加盟已没机会

曝卡里克希望曼联签托纳利,安德森是拉爵选择!一人加盟已没机会

罗米的曼联博客
2026-05-30 09:04:47
网红边牧被杀后续,警方上门,凶手咬死不犯法,全村逼狗主人认栽

网红边牧被杀后续,警方上门,凶手咬死不犯法,全村逼狗主人认栽

不写散文诗
2026-05-29 12:41:13
人类灭绝已成定局?科学家算出人类灭绝日期,我们还能幸存多久?

人类灭绝已成定局?科学家算出人类灭绝日期,我们还能幸存多久?

蜉蝣说
2026-05-28 19:49:46
法国与浙江都是6000多万人口,法国创造了3万多亿美元,浙江呢?

法国与浙江都是6000多万人口,法国创造了3万多亿美元,浙江呢?

商业财经风向
2026-05-28 09:52:51
学医后才明白,预防骨质疏松最好的习惯,不是晒太阳,而是3件事

学医后才明白,预防骨质疏松最好的习惯,不是晒太阳,而是3件事

垚垚分享健康
2026-05-04 19:15:04
童年时的金晨与父亲金延杰的合影,金延杰是国家一级古典舞演员

童年时的金晨与父亲金延杰的合影,金延杰是国家一级古典舞演员

娱你同欢
2026-05-29 21:20:30
解放军还是手软了,荷兰军舰闯西沙时的一个动作,本该被当场击沉

解放军还是手软了,荷兰军舰闯西沙时的一个动作,本该被当场击沉

阿龙聊军事
2026-05-28 10:14:28
0点欧冠决赛打响!阿森纳最强阵冲首冠+3大神迹,巴黎56%概率卫冕

0点欧冠决赛打响!阿森纳最强阵冲首冠+3大神迹,巴黎56%概率卫冕

我爱英超
2026-05-30 07:14:28
爆锅了!一女子直言再穷,也绝不会去夜店做公主,炸出1.2万评论

爆锅了!一女子直言再穷,也绝不会去夜店做公主,炸出1.2万评论

火山詩话
2026-05-24 06:41:17
张军林任西安市委常委、组织部部长

张军林任西安市委常委、组织部部长

汲古知新
2026-05-30 00:07:14
西方垄断七十年,全球最缺水的地方,为何突然向中国全面开放?

西方垄断七十年,全球最缺水的地方,为何突然向中国全面开放?

潘冹旅行浪子
2026-05-30 14:32:03
麻省理工出品,AI时代人人必修的最佳公开课!从传感器到大模型,手把手教你调试AI的“艺术”

麻省理工出品,AI时代人人必修的最佳公开课!从传感器到大模型,手把手教你调试AI的“艺术”

麻省理工AI公开课
2026-05-30 15:26:29
要求单独会晤被拒,日本高官在APEC会议发泄不满,拦住王文涛部长

要求单独会晤被拒,日本高官在APEC会议发泄不满,拦住王文涛部长

田柳
2026-05-29 09:00:11
划清界限?李显龙访华后公开表态:新加坡和中国不是“共同族群”

划清界限?李显龙访华后公开表态:新加坡和中国不是“共同族群”

悄悄史话
2026-05-30 11:17:34
中国女排头号球星是谁?国际排联的两张海报给出答案,不是李盈莹

中国女排头号球星是谁?国际排联的两张海报给出答案,不是李盈莹

老高说体育
2026-05-30 12:06:36
2026-05-30 16:23:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11934文章数 117088关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

香港著名演员刘洵离世 《倩女幽魂》中曾饰演普渡慈航

头条要闻

香港著名演员刘洵离世 《倩女幽魂》中曾饰演普渡慈航

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

向太曝黄晓明曾当众给她下跪

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

教育
亲子
本地
艺术
公开课

教育要闻

四川大学第1专业,就业现状与报考性价比分析!#金榜同行人

亲子要闻

昨天因为谁先当考官的事,俩助教起争执了,今天为了避免矛盾..

本地新闻

用剪纸的方式,打开江苏扬州

艺术要闻

王文生 2026风景写生新作

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版