网易首页 > 网易科技 > IT业界 > 正文

OpenAI放大招!GPT-4.1上线,编程战力全开

0
分享至

4月15日消息,美国人工智能公司OpenAI本周一宣布推出一系列全新的人工智能模型,这些模型专为编程任务优化,旨在应对来自谷歌、Anthropic等公司日益激烈的竞争。开发者现已可通过OpenAI的应用程序编程接口(API)使用这些模型。

OpenAI此次发布三个版本模型:GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano。公司首席产品官凯文·韦尔(Kevin Weil)在直播活动中表示,新模型在多方面超越当前主流产品GPT-4o,在某些性能指标上甚至优于最强大的旗舰模型GPT-4.5。

在权威的SWE-Bench编程基准测试中,GPT-4.1获得55%的得分,较其他OpenAI模型高出几个百分点。韦尔称:"这些新模型不仅擅长编程,更能精准执行复杂指令,是开发'智能体'的绝佳选择。"

近几个月来,人工智能模型的代码生成能力显著提升,推动软件原型开发自动化与"智能体"能力升级。竞争对手Anthropic和谷歌均已推出擅长代码生成的模型。此前业内盛传OpenAI将发布GPT-4.1,知情人士透露该公司曾以"Alpha Quasar"为代号在多个评测平台进行匿名测试。有Reddit用户反馈该"匿名"模型"修复了其他大语言模型生成的所有不完整代码"。

新模型能同时分析的代码量是前代产品的八倍,代码优化与漏洞修复能力显著提升。其遵循指令能力也大幅改进,用户无需反复调整指令即可获得预期结果。演示中,GPT-4.1仅凭自然语言提示便快速构建出语言学习闪卡应用等程序。

开发者非常看重编程能力,我们重点提升了模型生成可执行代码的水平,”OpenAI后续训练团队负责人米歇尔·波克拉丝(Michelle Pokrass)透露。“我们持续改进模型遵循多种编程格式的能力,使其能更深入地探索代码库、可靠运行单元测试,并编写可直接编译的代码。”

OpenAI表示,GPT-4.1较开发者最常用的GPT-4o提速40%,查询输入成本降低80%。

人工智能编程工具Windsurf的首席执行官瓦伦·莫汉(Varun Mohan)在直播中表示,他们在对GPT-4.1进行内部基准测试时发现,新模型性能较GPT-4o提高60%。他透露,新模型错误行为明显减少,新模型错误读取和编辑无关文件所耗费的时间显著减少。

过去几年中,OpenAI凭借2022年底推出的卓越聊天机器人ChatGPT引发的狂热关注,将公众兴趣转化为不断扩大的业务,逐步构建起包含多款先进模型的商业版图。上周,公司首席执行官萨姆·奥特曼(Sam Altman)在TED访谈中透露,OpenAI每周活跃用户已超过5亿且持续快速增长。

如今,OpenAI上线了种类繁多、功能各异、定价各不相同的模型。今年2月份公司发布最强大的旗舰模型GPT-4.5,不过目前仍处于“研究预览”阶段。

此外,OpenAI还上线了具备模拟推理能力的o1和o3模型。这些模型能够将问题分解为多个部分解决,响应用户的耗时较长,且使用成本较高。

ChatGPT的成功使得竞争对手近年来纷纷加大研发投入,力图赶超OpenAI。据斯坦福大学本月发布的一份报告,谷歌、DeepSeek等公司开发的模型性能已经比肩OpenAI。报告还指出,Anthropic、Meta以及法国创企Mistral等公司亦紧随其后。

华盛顿大学名誉教授奥伦·埃齐奥尼(Oren Etzioni)表示,未来不太可能由单一模型或一家公司垄断市场。“随着成本下降、开源普及以及生物、芯片设计等专业领域的专用模型崛起,未来将呈现多元发展格局。”曾任艾伦人工智能研究所(AI2)负责人的埃齐奥尼呼吁行业着眼大模型训练成本与环境影响。

面对盈利压力,OpenAI正加速商业化步伐。今年2月份公司首席运营官布拉德·莱特卡普(Brad Lightcap)接受采访时表示,每周活跃用户虽已经超过4亿,较2024年12月份增长30%,但由于持续重金投资研发和基础设施建设,OpenAI仍亏损数十亿美元。今年1月份,OpenAI宣布将与软银、Oracle和MGX合作推进“星际之门”计划,承诺斥资5000亿美元建设人工智能数据中心。

近期OpenAI持续推出新功能。上周,奥特曼宣布ChatGPT将升级“记忆”功能,使聊天机器人能更好地记住并调用此前的对话内容;3月底,奥特曼宣布计划今年夏季将推出一款开源权重模型,允许开发者免费下载并修改,公司将在未来几周内开始测试。由于开放权重模型能够根据不同用途进行定制且使用成本更低,它们已受到研究人员、开发者和初创企业的广泛欢迎。(辰辰)

延伸阅读
相关推荐
热点推荐
大陆表态后、郑丽文一鸣惊人!赖清德终成笑话,国民党3人丢尽脸

大陆表态后、郑丽文一鸣惊人!赖清德终成笑话,国民党3人丢尽脸

娱乐圈的笔娱君
2026-05-05 12:45:29
中国须做最坏打算:若俄罗斯解体,700万土地必保

中国须做最坏打算:若俄罗斯解体,700万土地必保

清晨的世界
2026-05-03 22:41:08
完爆胡明轩+碾压徐杰!广东第一克星确认到位,杜锋争冠计划落空

完爆胡明轩+碾压徐杰!广东第一克星确认到位,杜锋争冠计划落空

绯雨儿
2026-05-06 12:42:48
兔宝宝:公司对兔宝宝(柬埔寨)地板有限公司持股76.2%,湖州博锐贸易有限公司对其持股23.8%

兔宝宝:公司对兔宝宝(柬埔寨)地板有限公司持股76.2%,湖州博锐贸易有限公司对其持股23.8%

每日经济新闻
2026-05-06 09:06:08
为什么现金受贿还是会被查到?监委的3个手段你根本想不到

为什么现金受贿还是会被查到?监委的3个手段你根本想不到

细说职场
2026-04-29 19:07:44
今年五一,楼市扯下了最后遮羞布

今年五一,楼市扯下了最后遮羞布

房产老司机
2026-05-05 11:35:27
注意!中老年男性有性生活和没性生活,差别居然这么大?

注意!中老年男性有性生活和没性生活,差别居然这么大?

皓皓情感说
2026-04-22 08:20:32
回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

飞云如水
2024-11-13 06:54:13
五一之际美伊冲突撕下美“强国”伪装

五一之际美伊冲突撕下美“强国”伪装

风铃草语
2026-05-06 06:37:37
“警惕一个越来越危险的日本”系列评论之七:日本复活“特高课”为军事冒险做铺垫

“警惕一个越来越危险的日本”系列评论之七:日本复活“特高课”为军事冒险做铺垫

环球网资讯
2026-05-06 06:46:09
女儿被绑架撕票,56岁瘸腿母亲独闯贩毒集团,挨个清算

女儿被绑架撕票,56岁瘸腿母亲独闯贩毒集团,挨个清算

三目观史
2026-04-27 22:32:40
首发时20战19胜!感谢勇士尼克斯,雷霆3年870万捡宝,比里夫斯强

首发时20战19胜!感谢勇士尼克斯,雷霆3年870万捡宝,比里夫斯强

你的篮球频道
2026-05-06 13:53:45
49岁曾黎穿瑜伽裤晨跑被骂擦边:怎么穿都有错!

49岁曾黎穿瑜伽裤晨跑被骂擦边:怎么穿都有错!

马拉松跑步健身
2026-05-06 07:00:18
高市向天皇发重誓,不顾邻居感受,日本放出话来:将派百人团访华

高市向天皇发重誓,不顾邻居感受,日本放出话来:将派百人团访华

嫹笔牂牂
2026-05-05 14:26:37
高市对天皇发重誓48小时内美方急电王毅:日本核武底牌被中国撕碎

高市对天皇发重誓48小时内美方急电王毅:日本核武底牌被中国撕碎

触摸史迹
2026-05-05 06:42:43
中组部人社部规定:公职人员违纪后待遇一文讲清

中组部人社部规定:公职人员违纪后待遇一文讲清

笑熬浆糊111
2026-04-23 00:05:18
5月6日1/8决赛+CCTV5直播:国乒男队VS罗马尼亚,国乒女队VS瑞典

5月6日1/8决赛+CCTV5直播:国乒男队VS罗马尼亚,国乒女队VS瑞典

开成运动会
2026-05-06 12:44:29
“最美丈母娘”沈丹萍:女儿婚房仅40平米,她处处替女婿家着想

“最美丈母娘”沈丹萍:女儿婚房仅40平米,她处处替女婿家着想

细品名人
2026-05-02 05:59:32
NBA官方罚单:杰伦-布朗出局抨击该调查3名裁判 被罚款5万美元

NBA官方罚单:杰伦-布朗出局抨击该调查3名裁判 被罚款5万美元

醉卧浮生
2026-05-06 08:34:23
中纪委通报!院士候选人、大学原校长,接受审查调查

中纪委通报!院士候选人、大学原校长,接受审查调查

TOP大学来了
2026-05-05 21:30:47
2026-05-06 17:51:00

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

中国发布阻断禁令后鲁比奥声称将二次制裁 外交部回应

头条要闻

中国发布阻断禁令后鲁比奥声称将二次制裁 外交部回应

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

神仙友谊!杨紫连续10年为张一山庆生

财经要闻

最新GDP!全国30强城市,又变了

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

时尚
旅游
教育
数码
艺术

夏天的白裙,可以像赫本那样穿

旅游要闻

贵州仁怀:“温泉”新业态激起一池“文旅”活水

教育要闻

广东高考提前批全攻略,17 军校 + 6 警校 + 12 综评,规则分数避坑讲透

数码要闻

核显本竟敢卖到万元级别!荣耀MagicBook Pro16 2026全面评测:88W满血 + 92Wh续航,这可能是史上最强的核显

艺术要闻

震撼!康斯坦丁摄影作品里的性感曲线让人惊艳!

无障碍浏览 进入关怀版
×