网易首页 > 网易科技 > IT业界 > 正文

OpenAI放大招!GPT-4.1上线,编程战力全开

0
分享至

4月15日消息,美国人工智能公司OpenAI本周一宣布推出一系列全新的人工智能模型,这些模型专为编程任务优化,旨在应对来自谷歌、Anthropic等公司日益激烈的竞争。开发者现已可通过OpenAI的应用程序编程接口(API)使用这些模型。

OpenAI此次发布三个版本模型:GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano。公司首席产品官凯文·韦尔(Kevin Weil)在直播活动中表示,新模型在多方面超越当前主流产品GPT-4o,在某些性能指标上甚至优于最强大的旗舰模型GPT-4.5。

在权威的SWE-Bench编程基准测试中,GPT-4.1获得55%的得分,较其他OpenAI模型高出几个百分点。韦尔称:"这些新模型不仅擅长编程,更能精准执行复杂指令,是开发'智能体'的绝佳选择。"

近几个月来,人工智能模型的代码生成能力显著提升,推动软件原型开发自动化与"智能体"能力升级。竞争对手Anthropic和谷歌均已推出擅长代码生成的模型。此前业内盛传OpenAI将发布GPT-4.1,知情人士透露该公司曾以"Alpha Quasar"为代号在多个评测平台进行匿名测试。有Reddit用户反馈该"匿名"模型"修复了其他大语言模型生成的所有不完整代码"。

新模型能同时分析的代码量是前代产品的八倍,代码优化与漏洞修复能力显著提升。其遵循指令能力也大幅改进,用户无需反复调整指令即可获得预期结果。演示中,GPT-4.1仅凭自然语言提示便快速构建出语言学习闪卡应用等程序。

开发者非常看重编程能力,我们重点提升了模型生成可执行代码的水平,”OpenAI后续训练团队负责人米歇尔·波克拉丝(Michelle Pokrass)透露。“我们持续改进模型遵循多种编程格式的能力,使其能更深入地探索代码库、可靠运行单元测试,并编写可直接编译的代码。”

OpenAI表示,GPT-4.1较开发者最常用的GPT-4o提速40%,查询输入成本降低80%。

人工智能编程工具Windsurf的首席执行官瓦伦·莫汉(Varun Mohan)在直播中表示,他们在对GPT-4.1进行内部基准测试时发现,新模型性能较GPT-4o提高60%。他透露,新模型错误行为明显减少,新模型错误读取和编辑无关文件所耗费的时间显著减少。

过去几年中,OpenAI凭借2022年底推出的卓越聊天机器人ChatGPT引发的狂热关注,将公众兴趣转化为不断扩大的业务,逐步构建起包含多款先进模型的商业版图。上周,公司首席执行官萨姆·奥特曼(Sam Altman)在TED访谈中透露,OpenAI每周活跃用户已超过5亿且持续快速增长。

如今,OpenAI上线了种类繁多、功能各异、定价各不相同的模型。今年2月份公司发布最强大的旗舰模型GPT-4.5,不过目前仍处于“研究预览”阶段。

此外,OpenAI还上线了具备模拟推理能力的o1和o3模型。这些模型能够将问题分解为多个部分解决,响应用户的耗时较长,且使用成本较高。

ChatGPT的成功使得竞争对手近年来纷纷加大研发投入,力图赶超OpenAI。据斯坦福大学本月发布的一份报告,谷歌、DeepSeek等公司开发的模型性能已经比肩OpenAI。报告还指出,Anthropic、Meta以及法国创企Mistral等公司亦紧随其后。

华盛顿大学名誉教授奥伦·埃齐奥尼(Oren Etzioni)表示,未来不太可能由单一模型或一家公司垄断市场。“随着成本下降、开源普及以及生物、芯片设计等专业领域的专用模型崛起,未来将呈现多元发展格局。”曾任艾伦人工智能研究所(AI2)负责人的埃齐奥尼呼吁行业着眼大模型训练成本与环境影响。

面对盈利压力,OpenAI正加速商业化步伐。今年2月份公司首席运营官布拉德·莱特卡普(Brad Lightcap)接受采访时表示,每周活跃用户虽已经超过4亿,较2024年12月份增长30%,但由于持续重金投资研发和基础设施建设,OpenAI仍亏损数十亿美元。今年1月份,OpenAI宣布将与软银、Oracle和MGX合作推进“星际之门”计划,承诺斥资5000亿美元建设人工智能数据中心。

近期OpenAI持续推出新功能。上周,奥特曼宣布ChatGPT将升级“记忆”功能,使聊天机器人能更好地记住并调用此前的对话内容;3月底,奥特曼宣布计划今年夏季将推出一款开源权重模型,允许开发者免费下载并修改,公司将在未来几周内开始测试。由于开放权重模型能够根据不同用途进行定制且使用成本更低,它们已受到研究人员、开发者和初创企业的广泛欢迎。(辰辰)

延伸阅读
相关推荐
热点推荐
王皓真生气了!连问林诗栋2遍“懂不懂” 赛后情绪激动当场做复盘

王皓真生气了!连问林诗栋2遍“懂不懂” 赛后情绪激动当场做复盘

风过乡
2025-12-15 08:15:40
一批家长正“以爱之名”,亲手把孩子送上征信黑名单

一批家长正“以爱之名”,亲手把孩子送上征信黑名单

新东方
2025-12-15 17:15:01
“二王”的枪法有多准?跟他同时开枪的民警,受处分后黯然下岗

“二王”的枪法有多准?跟他同时开枪的民警,受处分后黯然下岗

徐慍解说
2025-12-12 12:08:08
向太曝马伊琍已再婚:当年文章过不了心理那关

向太曝马伊琍已再婚:当年文章过不了心理那关

娱乐看阿敞
2025-12-12 15:50:00
俄罗斯未料到,美国更未料到,当下的中国石油,跻身石油遥遥领先

俄罗斯未料到,美国更未料到,当下的中国石油,跻身石油遥遥领先

陈博世财经
2025-12-15 14:22:42
1950年朝鲜战火烧到眉毛,林彪盯着出兵名单上的司令名字,突然眉头紧锁拍了桌子:这个人必须马上换掉!

1950年朝鲜战火烧到眉毛,林彪盯着出兵名单上的司令名字,突然眉头紧锁拍了桌子:这个人必须马上换掉!

寄史言志
2025-12-14 19:06:16
悉尼枪击惨案中徒手夺枪的穆斯林英雄

悉尼枪击惨案中徒手夺枪的穆斯林英雄

魏城看天下
2025-12-15 03:48:12
透视“35岁女货车司机”神话的每个虚假字眼

透视“35岁女货车司机”神话的每个虚假字眼

细雨中的呼喊
2025-12-14 17:42:35
华润啤酒东北大撤退余波:闲置工厂降价百万无人接盘,员工安置费用花掉数亿元

华润啤酒东北大撤退余波:闲置工厂降价百万无人接盘,员工安置费用花掉数亿元

时代财经
2025-12-15 08:12:09
超市员工透漏:“超市里有这5不买,谁买谁上当”!5不买指的是啥

超市员工透漏:“超市里有这5不买,谁买谁上当”!5不买指的是啥

阿龙美食记
2025-12-12 12:27:46
老詹僭越了?雷迪克:技术犯规罚球本该东契奇罚的,我们安排过

老詹僭越了?雷迪克:技术犯规罚球本该东契奇罚的,我们安排过

懂球帝
2025-12-15 14:20:22
体坛:徐正源已中止与成都蓉城的续约谈判,可能重返K联赛

体坛:徐正源已中止与成都蓉城的续约谈判,可能重返K联赛

懂球帝
2025-12-15 18:35:08
生娃基本“不花钱”,制度托底让生育更友好

生娃基本“不花钱”,制度托底让生育更友好

南方都市报
2025-12-14 23:37:10
里弗斯谈45分惨败:这可能是我参与过的最令人失望的比赛

里弗斯谈45分惨败:这可能是我参与过的最令人失望的比赛

北青网-北京青年报
2025-12-15 11:56:03
比芋头便宜、比红薯营养!冬天吃,一通便,二止咳,三能解百毒

比芋头便宜、比红薯营养!冬天吃,一通便,二止咳,三能解百毒

阿龙美食记
2025-12-14 13:31:11
云南体育局:成立调查组全面开展调查

云南体育局:成立调查组全面开展调查

澎湃新闻
2025-12-15 14:55:12
26岁的闵超当上博导,浙江大学在“新百人计划”邪修的路上越走越远了

26岁的闵超当上博导,浙江大学在“新百人计划”邪修的路上越走越远了

黄师娘
2025-12-15 10:01:39
新农合涨到400元,农民断缴背后的扎心真相

新农合涨到400元,农民断缴背后的扎心真相

冰川思想库
2025-12-15 11:09:26
中国足球留洋利好:大黑将志首次成为日本职业联赛主教练!

中国足球留洋利好:大黑将志首次成为日本职业联赛主教练!

邱泽云
2025-12-15 16:08:36
日媒:张本智和总决赛右肩负伤,决赛服用止痛药出战

日媒:张本智和总决赛右肩负伤,决赛服用止痛药出战

懂球帝
2025-12-15 19:00:01
2025-12-15 20:07:00

科技要闻

大佬冷酷预言:未来15年 人形机器人成废铁

头条要闻

霸王茶姬创始人与"光伏二代"举办婚礼 两人穿中式婚服

头条要闻

霸王茶姬创始人与"光伏二代"举办婚礼 两人穿中式婚服

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

何晴告别式现场,前夫许亚军双眼泛红?

财经要闻

新农合涨到400元 农民断缴背后的扎心真相

汽车要闻

主驾配按摩还可选6座 新款捷途X90PRO售13.59万起

态度原创

时尚
家居
亲子
健康
军事航空

伊姐周日热推:电视剧《老舅》;电视剧《哑舍》......

家居要闻

温暖色调 大空间不冷清

亲子要闻

加码“低敏”赛道!海普诺凯能立多全新升级,以科研实证回应“敏宝”家庭刚需

这些新疗法,让化疗不再那么痛苦

军事要闻

泽连斯基称乌方已妥协不加入北约 俄方发声

无障碍浏览 进入关怀版
×