网易首页 > 网易号 > 正文 申请入驻

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens

0
分享至

IT之家 4 月 15 日消息,OpenAI 公司今天(4 月 15 日)发布博文,宣布以 API 的形式发布 GPT-4.1 系列模型,涵盖 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

这些模型在编程、指令遵循和长文本理解方面全面超越前代 GPT-4o 及 GPT-4o mini,上下文窗口最高支持 100 万 tokens,知识更新至 2024 年 6 月。

需要注意的是,该系列模型现阶段专为开发者打造,目前仅通过开发者 API 方式提供,普通用户暂时无法通过 ChatGPT 页面体验该模型。

OpenAI 表示在编程方面,相比较 GPT-4o 模型,GPT-4.1 模型的代码生成速度飙升 40%,且用户输入查询的成本降低了 80%。

新模型性能

OpenAI 在官方博文中表示,GPT-4.1 系列模型在编程、指令遵循和长文本处理上表现优异,全面超越 GPT-4o 及 GPT-4o mini。

GPT-4.1 在编程测试 SWE-bench Verified 中得分 54.6%,较 GPT-4o 提升 21.4 个百分点,在指令遵循测试 MultiChallenge 中提升 10.5 个百分点,在多模态长文本测试 Video-MME 中创下 72.0% 的新纪录。

GPT-4.1 mini 和 nano 展现了小型模型的巨大潜力。GPT-4.1 mini 在多项基准测试中媲美甚至超越 GPT-4o,延迟降低近一半,成本减少 83%。

GPT-4.1 nano 作为最快、最经济的选择,拥有 100 万个 token 的上下文窗口,在 MMLU 测试中得分 80.1%,适合分类和自动补全任务。

这些模型通过优化推理栈和提示缓存技术,显著降低了首次响应时间,为开发者提供高效低成本的解决方案。

GPT-4.1 系列模型在实际应用中表现突出,特别适合构建智能代理,处理复杂任务。例如,Windsurf 测试显示,GPT-4.1 在编程效率上提升 30%,减少 50% 不必要编辑;Thomson Reuters 的法律 AI 助手 CoCounsel 使用 GPT-4.1 后,多文档审查准确率提升 17%。

命名混乱引发关注

GPT-4.1 的发布加剧了 OpenAI 产品命名的复杂性。

ChatGPT 目前已包含 GPT-4o、GPT-4o mini、o1-pro 等多种模型选项。OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)早在 2024 年 2 月就承认命名问题。

他在 X 平台表示,产品线过于繁杂,计划通过未来的 GPT-5 整合品牌,OpenAI 计划在 2025 年 7 月前逐步淘汰 API 中的 GPT-4.5 Preview 模型,从而缓解命名混乱。

这一临时模型于 2024 年 2 月推出,曾被批评为“失败品”,开发者需在 2025 年 7 月前迁移到其他模型,不过,GPT-4.5 在 ChatGPT 中暂时保留,未受影响。

费用

API价格方面,OpenAIGPT-4.1模型每 100万tokens输入费用为 2 美元(IT之家注:现汇率约合 14.6 元人民币),每 100万tokens输出费用为 8 美元(现汇率约合 58.3 元人民币)。在中等查询中,相比较GPT-4o,GPT-4.1不仅能提供更强悍的性能,而且便宜 26%。

此外,OpenAIGPT-4.1nano是OpenAI最便宜、最快的模型:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

妍妍教育日记
2026-04-24 11:15:25
当下就业最难的专业,清华毕业都哭诉找不到工作!

当下就业最难的专业,清华毕业都哭诉找不到工作!

黯泉
2026-04-11 15:03:59
台岛仅剩12个“邦交”,但全是硬茬,大陆一个个拔除要费不少功夫

台岛仅剩12个“邦交”,但全是硬茬,大陆一个个拔除要费不少功夫

凉羽亭
2026-04-27 21:08:47
买香蕉时,这5种香蕉不要买!水果老板自己都不吃,看完转发家人

买香蕉时,这5种香蕉不要买!水果老板自己都不吃,看完转发家人

花小厨
2026-04-29 15:16:50
076四川舰海试成功攻克飞翼无人机起降难题

076四川舰海试成功攻克飞翼无人机起降难题

明天见灌装冰块
2026-04-26 20:14:26
蔡少芬山姆购物,打扮超酷又瘦又高,买满三购物车太壕了

蔡少芬山姆购物,打扮超酷又瘦又高,买满三购物车太壕了

小武侃风云
2026-04-26 18:52:45
谷歌Gemini新增功能:支持在聊天界面直接生成并下载文件

谷歌Gemini新增功能:支持在聊天界面直接生成并下载文件

龙剑秀南
2026-04-30 12:20:43
巩俐巴黎街头与丈夫争执摔花,77岁老公一个摸头杀,全网破防

巩俐巴黎街头与丈夫争执摔花,77岁老公一个摸头杀,全网破防

茶余饭好
2026-04-27 20:20:50
不想访华了?特朗普联手27国针对中国,话音刚落,中方制裁令下达

不想访华了?特朗普联手27国针对中国,话音刚落,中方制裁令下达

易昂杨
2026-04-28 14:17:46
张军被查推倒多米诺骨牌!媒体人:金牌不是护身符,还有1人未公开

张军被查推倒多米诺骨牌!媒体人:金牌不是护身符,还有1人未公开

刘哥谈体育
2026-04-30 14:51:27
余生漫漫,唯愿与你静静相伴

余生漫漫,唯愿与你静静相伴

青苹果sht
2026-04-29 05:27:19
曝马宁主哨申蓉大战!蓉城7战仅2胜,2年前曾红牌罚下韦世豪

曝马宁主哨申蓉大战!蓉城7战仅2胜,2年前曾红牌罚下韦世豪

奥拜尔
2026-04-30 17:06:24
捂嘴就红牌!国际足联推出“维尼修斯规则”,疑罪从有引争议

捂嘴就红牌!国际足联推出“维尼修斯规则”,疑罪从有引争议

足球报
2026-04-30 11:14:52
全球首创!字节跳动首个AI药物曝光,背后37人团队亮相,前信达总裁任顾问!

全球首创!字节跳动首个AI药物曝光,背后37人团队亮相,前信达总裁任顾问!

智药局
2026-04-28 19:01:39
最高评分飙至9.8,这6部古装剧,每一部都是天花板级别的神作

最高评分飙至9.8,这6部古装剧,每一部都是天花板级别的神作

小微看电影
2026-04-30 14:45:03
李敏因生病入住301医院,护士得知她是毛主席的女儿,开了个玩笑

李敏因生病入住301医院,护士得知她是毛主席的女儿,开了个玩笑

翠羽
2026-04-29 08:50:11
iPhone 开放钱包 NFC!支持升级了

iPhone 开放钱包 NFC!支持升级了

花果科技
2026-04-30 14:38:22
砸进六个师,谈判桌都不给!铁了心的以色列,真主党在劫难逃吗?

砸进六个师,谈判桌都不给!铁了心的以色列,真主党在劫难逃吗?

寰球经纬所
2026-04-27 23:35:08
CBA季后赛G2明天5月1日赛程:广东生死战,辽宁PK山东冲击8强

CBA季后赛G2明天5月1日赛程:广东生死战,辽宁PK山东冲击8强

薇说体育
2026-04-30 15:50:16
人民日报痛批大学生 “沉睡” 现象:躺平四年,毕业真的会失业!

人民日报痛批大学生 “沉睡” 现象:躺平四年,毕业真的会失业!

复转这些年
2026-03-25 10:02:32
2026-04-30 18:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
341962文章数 607177关注度
往期回顾 全部

科技要闻

四巨头财报齐发:AI已经不只是风口

头条要闻

媒体:打了9周烧了250亿 特朗普现在要“窒息”伊朗

头条要闻

媒体:打了9周烧了250亿 特朗普现在要“窒息”伊朗

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

孙杨博士学历有问题?官方含糊其辞

财经要闻

易会满被“双开”!

汽车要闻

专访捷途汪如生:捷途双线作战 全球化全面落地

态度原创

教育
本地
亲子
房产
公开课

教育要闻

5月5日!南京一中国际部与你一见“中”情

本地新闻

用青花瓷的方式,打开西溪湿地

亲子要闻

刚出生的宝宝第一次睁眼,瞬间心都融化了

房产要闻

熬了6年,涨了2亿,三亚核心区这块地再次上架

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版