网易首页 > 网易科技 > IT业界 > 正文

OpenAI放大招!GPT-4.1上线,编程战力全开

0
分享至

4月15日消息,美国人工智能公司OpenAI本周一宣布推出一系列全新的人工智能模型,这些模型专为编程任务优化,旨在应对来自谷歌、Anthropic等公司日益激烈的竞争。开发者现已可通过OpenAI的应用程序编程接口(API)使用这些模型。

OpenAI此次发布三个版本模型:GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano。公司首席产品官凯文·韦尔(Kevin Weil)在直播活动中表示,新模型在多方面超越当前主流产品GPT-4o,在某些性能指标上甚至优于最强大的旗舰模型GPT-4.5。

在权威的SWE-Bench编程基准测试中,GPT-4.1获得55%的得分,较其他OpenAI模型高出几个百分点。韦尔称:"这些新模型不仅擅长编程,更能精准执行复杂指令,是开发'智能体'的绝佳选择。"

近几个月来,人工智能模型的代码生成能力显著提升,推动软件原型开发自动化与"智能体"能力升级。竞争对手Anthropic和谷歌均已推出擅长代码生成的模型。此前业内盛传OpenAI将发布GPT-4.1,知情人士透露该公司曾以"Alpha Quasar"为代号在多个评测平台进行匿名测试。有Reddit用户反馈该"匿名"模型"修复了其他大语言模型生成的所有不完整代码"。

新模型能同时分析的代码量是前代产品的八倍,代码优化与漏洞修复能力显著提升。其遵循指令能力也大幅改进,用户无需反复调整指令即可获得预期结果。演示中,GPT-4.1仅凭自然语言提示便快速构建出语言学习闪卡应用等程序。

开发者非常看重编程能力,我们重点提升了模型生成可执行代码的水平,”OpenAI后续训练团队负责人米歇尔·波克拉丝(Michelle Pokrass)透露。“我们持续改进模型遵循多种编程格式的能力,使其能更深入地探索代码库、可靠运行单元测试,并编写可直接编译的代码。”

OpenAI表示,GPT-4.1较开发者最常用的GPT-4o提速40%,查询输入成本降低80%。

人工智能编程工具Windsurf的首席执行官瓦伦·莫汉(Varun Mohan)在直播中表示,他们在对GPT-4.1进行内部基准测试时发现,新模型性能较GPT-4o提高60%。他透露,新模型错误行为明显减少,新模型错误读取和编辑无关文件所耗费的时间显著减少。

过去几年中,OpenAI凭借2022年底推出的卓越聊天机器人ChatGPT引发的狂热关注,将公众兴趣转化为不断扩大的业务,逐步构建起包含多款先进模型的商业版图。上周,公司首席执行官萨姆·奥特曼(Sam Altman)在TED访谈中透露,OpenAI每周活跃用户已超过5亿且持续快速增长。

如今,OpenAI上线了种类繁多、功能各异、定价各不相同的模型。今年2月份公司发布最强大的旗舰模型GPT-4.5,不过目前仍处于“研究预览”阶段。

此外,OpenAI还上线了具备模拟推理能力的o1和o3模型。这些模型能够将问题分解为多个部分解决,响应用户的耗时较长,且使用成本较高。

ChatGPT的成功使得竞争对手近年来纷纷加大研发投入,力图赶超OpenAI。据斯坦福大学本月发布的一份报告,谷歌、DeepSeek等公司开发的模型性能已经比肩OpenAI。报告还指出,Anthropic、Meta以及法国创企Mistral等公司亦紧随其后。

华盛顿大学名誉教授奥伦·埃齐奥尼(Oren Etzioni)表示,未来不太可能由单一模型或一家公司垄断市场。“随着成本下降、开源普及以及生物、芯片设计等专业领域的专用模型崛起,未来将呈现多元发展格局。”曾任艾伦人工智能研究所(AI2)负责人的埃齐奥尼呼吁行业着眼大模型训练成本与环境影响。

面对盈利压力,OpenAI正加速商业化步伐。今年2月份公司首席运营官布拉德·莱特卡普(Brad Lightcap)接受采访时表示,每周活跃用户虽已经超过4亿,较2024年12月份增长30%,但由于持续重金投资研发和基础设施建设,OpenAI仍亏损数十亿美元。今年1月份,OpenAI宣布将与软银、Oracle和MGX合作推进“星际之门”计划,承诺斥资5000亿美元建设人工智能数据中心。

近期OpenAI持续推出新功能。上周,奥特曼宣布ChatGPT将升级“记忆”功能,使聊天机器人能更好地记住并调用此前的对话内容;3月底,奥特曼宣布计划今年夏季将推出一款开源权重模型,允许开发者免费下载并修改,公司将在未来几周内开始测试。由于开放权重模型能够根据不同用途进行定制且使用成本更低,它们已受到研究人员、开发者和初创企业的广泛欢迎。(辰辰)

延伸阅读
相关推荐
热点推荐
上海一位短线高手,用最简单的方法操作,股市资产竟达到了八位数

上海一位短线高手,用最简单的方法操作,股市资产竟达到了八位数

一方聊市
2025-12-16 13:31:22
火箭队追怀特,斯通一石二鸟?2技能获提升,1200万年薪可留可弃

火箭队追怀特,斯通一石二鸟?2技能获提升,1200万年薪可留可弃

熊哥爱篮球
2026-02-04 13:04:14
备好巨额转会费,土超豪门特拉布宗体育全力引进日本国脚攻击手

备好巨额转会费,土超豪门特拉布宗体育全力引进日本国脚攻击手

衔春信
2026-02-04 19:10:48
贝林厄姆发布头戴氧气面罩自拍照:生活还要继续

贝林厄姆发布头戴氧气面罩自拍照:生活还要继续

懂球帝
2026-02-04 11:10:39
市场失序,金银只是开始!

市场失序,金银只是开始!

米宅海外
2026-02-04 08:03:34
阿森纳VS国米现役身价最贵阵容!国米这么惨了?身价仅阿森纳一半

阿森纳VS国米现役身价最贵阵容!国米这么惨了?身价仅阿森纳一半

体坛八点半的那些事儿
2026-02-04 18:41:03
安德鲁夫妻向爱泼斯坦“献祭”女儿遭王室切割,长女携女示忠,幼女厌恶拒接触

安德鲁夫妻向爱泼斯坦“献祭”女儿遭王室切割,长女携女示忠,幼女厌恶拒接触

今日搞笑分享
2026-02-04 17:29:01
司美格鲁肽去年卖了2508亿元

司美格鲁肽去年卖了2508亿元

第一财经资讯
2026-02-04 16:16:23
56岁窦唯现状:已定居阿那亚多年,骑电动车,买菜砍价,生活惬意

56岁窦唯现状:已定居阿那亚多年,骑电动车,买菜砍价,生活惬意

银河史记
2026-02-03 11:20:31
袁悦扔拍庆祝!3小时24分钟赢下马拉松大战,王欣瑜追平生涯最佳

袁悦扔拍庆祝!3小时24分钟赢下马拉松大战,王欣瑜追平生涯最佳

排球黄金眼
2026-02-04 00:37:45
财政压力的下半场:退休人员占比近四成,才是硬账

财政压力的下半场:退休人员占比近四成,才是硬账

超先声
2026-01-09 16:45:39
不用坐牢了?马杜罗入狱3周后,中方斩钉截铁,委代元首接过兵权

不用坐牢了?马杜罗入狱3周后,中方斩钉截铁,委代元首接过兵权

安珈使者啊
2026-02-04 14:22:37
6连败!开拓者125-130太阳,斯普利特帅位不保,杨瀚森NBA迎转机

6连败!开拓者125-130太阳,斯普利特帅位不保,杨瀚森NBA迎转机

小火箭爱体育
2026-02-04 14:42:51
54岁朱茵现状:依旧开97年的车,住在深山残屋,状态一如既往的好

54岁朱茵现状:依旧开97年的车,住在深山残屋,状态一如既往的好

小熊侃史
2025-12-17 09:43:27
华国锋孙女华真,目前担任苏富比亚洲区副主席,此前系李云迪妻子

华国锋孙女华真,目前担任苏富比亚洲区副主席,此前系李云迪妻子

老杉说历史
2026-02-03 00:39:20
假山假景假脸,央视《生命树》的爆火,打脸多少“流水线”年代剧

假山假景假脸,央视《生命树》的爆火,打脸多少“流水线”年代剧

云舟史策
2026-01-30 23:05:34
小米潘九堂回应“转行卖车”:朋友圈玩笑被截图

小米潘九堂回应“转行卖车”:朋友圈玩笑被截图

IT之家
2026-02-03 18:11:07
沈佳妮之前就特直白地说过:“好多人都知道我老公朱亚文风度翩翩

沈佳妮之前就特直白地说过:“好多人都知道我老公朱亚文风度翩翩

小光侃娱乐
2026-02-03 13:25:03
深圳一公司马年给员工送宝马

深圳一公司马年给员工送宝马

深圳晚报
2026-02-04 14:41:00
美国正在试图控制全球所有的黄金航道和战略港口,而且还针对我国

美国正在试图控制全球所有的黄金航道和战略港口,而且还针对我国

达文西看世界
2026-02-04 19:44:57
2026-02-04 20:32:49

科技要闻

太烦人遭投诉!元宝红包链接被微信屏蔽

头条要闻

高市扬言修改宪法以明确承认日本自卫队 外交部回应

头条要闻

高市扬言修改宪法以明确承认日本自卫队 外交部回应

体育要闻

哈登回应交易:不想让自己拖累快船的未来

娱乐要闻

姜元来在大S墓碑前哭泣,与具俊晔拥抱

财经要闻

下一轮金融危机,会由沃什引爆吗?

汽车要闻

综合续航1730km 5座中级电混SUV吉利银河M7官图发布

态度原创

艺术
房产
教育
健康
公开课

艺术要闻

一篇文章看懂“传统吉祥图案”的寓意

房产要闻

还在涨!成交量连飙四个月 海口二手房开始稳了!

教育要闻

“难怪大学生不爱回家”,家长晒客厅邋遢照片,隔着屏幕都心累!

耳石症分类型,症状大不同

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×