网易首页 > 网易科技 > 网易科技 > 正文

GPT-4.5发布:比GPT-4提升10倍 但"并非前沿模型"

0
分享至

2月28日消息,美国时间周四,OpenAI宣布推出GPT-4.5,这是其最新、最强大的大语言模型(LLM)的研究预览版,专为聊天应用设计。不过,这也是OpenAI迄今为止最昂贵的模型。

不过,GPT-4.5仍然是一款传统的大型语言模型,而非“推理模型”。此前,OpenAI、DeepSeek、Anthropic等公司都推出了推理模型,这些模型能够生成“思维链”或类似意识流的文本,通过反思自身的假设和结论,尝试在向用户提供响应或输出之前捕捉错误。

尽管如此,OpenAI联合创始人兼首席执行官山姆·奥特曼(Sam Altman)在社交平台上表示,GPT-4.5是“第一个让我感觉像是在与一个有思想的人交谈的模型。我曾多次靠在椅背上,惊讶于AI能给出真正有用的建议。”


奥特曼还提醒道,由于GPU供应紧张,OpenAI不得不限制对GPT-4.5的访问。他指出:“坏消息是:这是一个庞大且昂贵的模型。我们本打算同时向Plus和Pro用户推出,但用户量大幅增长导致GPU资源不足。我们计划下周增加数万颗GPU,并随后向Plus订阅用户开放。(很快还会有数十万颗GPU到位,我相信大家会充分利用我们部署的每一颗GPU。)这并不是我们理想的运作方式,但很难完美预测导致GPU短缺的需求激增。”

从美国时间周四开始,GPT-4.5将向OpenAI的最昂贵订阅服务ChatGPT Pro(每月200美元)的用户开放,并向所有付费API层级的开发者提供访问权限。OpenAI还计划在下周将其扩展至价格相对较低的Plus和Team层级(每月20/30美元)。

GPT-4.5支持搜索功能和画布模式,用户还可以上传文件和图像,但目前还不支持其他多模态功能,如语音模式、视频和屏幕共享——至少暂时不支持。

通过无监督学习推动AI进步

GPT-4.5代表了人工智能训练领域的显著进步,尤其是在无监督学习方面,这大大提升了模型识别模式、建立联系以及生成创造性见解的能力。

OpenAI的研究人员提到,GPT-4.5通过基于较小人工智能模型生成的数据进行训练,这有助于提升其“世界模型”。他们还表示,该模型同时利用多个数据中心进行预训练,这意味着它采用了一种类似于竞争对手Nous Research的去中心化方法。

这种训练方式显然帮助GPT-4.5学会了生成更自然、更直观的交互,同时更准确地遵循用户意图,并展现出更高的情商。该模型在OpenAI此前关于人工智能扩展的工作基础上取得了突破,进一步验证了“增加数据和计算能力有助于提升人工智能性能”的理念。

与前代模型及其他同类产品相比,GPT-4.5预计能够显著减少幻觉现象(幻觉率为37.1%,相比之下GPT-4为61.8%),从而使其在处理广泛话题时更加可靠。

GPT-4.5的突出特点

根据OpenAI的说法,GPT-4.5旨在创造亲切自然、直观流畅的对话。它对语义细微差异和上下文有更强的把握能力,能够实现更像人类之间的互动,并更有效地与用户协作。

GPT-4.5通过扩展的知识库和敏锐的细微线索解读能力,在多个领域展现出色表现,包括:

——写作辅助:优化内容、提升清晰度、激发创意

——编程支持:调试、提出代码改进建议、自动化工作流程

——问题解决:提供详细解释,并协助做出实际决策

此外,GPT-4.5还采用了新的对齐技术,增强了其对人类偏好和意图的理解能力,进一步提升了用户体验。

如何访问GPT-4.5?

从美国当地时间周四开始,ChatGPT Pro用户可以在网页、移动端和桌面端的模型选择菜单中选择GPT-4.5。OpenAI计划在下周将该模型扩展到Plus和Team用户。

对于开发者,GPT-4.5将通过OpenAI的API提供,包括Chat Completions API、Assistants API和Batch API。它支持函数调用、结构化输出、流式传输、系统消息和图像输入等关键功能,使其成为多种人工智能驱动应用的通用工具。不过,GPT-4.5目前尚不支持语音模式、视频或屏幕共享等多模态功能。

定价及对企业决策者的影响

企业和团队领导者可以充分利用GPT-4.5带来的各种功能。凭借较低的幻觉率、增强的可靠性和自然流畅的对话能力,GPT-4.5能够支持广泛的业务功能:

——改善客户互动:企业可以将GPT-4.5集成到支持系统中,以实现更快、更自然的互动,同时减少错误

——增强内容生成:营销和传播团队可以高效地制作高质量、符合品牌的内容

——精简运营:人工智能驱动的自动化可以帮助调试、优化工作流程并支持战略决策

——可扩展性和定制化:API允许企业进行量身定制,构建符合其特定需求的人工智能解决方案

然而,对于希望通过GPT-4.5构建应用的第三方开发者来说,GPT-4.5的API定价高得惊人,每百万输入/输出token的价格为75美元/180美元,而GPT-4o的定价仅为2.50美元/10美元。

随着其他竞争对手模型的发布——如Anthropic的Claude 3.7、Google的Gemini 2 Pro,以及OpenAI自家的推理“o”系列(o1、o3-mini High、o3)——GPT-4.5的性能提升是否足以抵消其高昂成本,特别是在通过API使用时,将成为一个值得关注的问题。

AI研究人员与资深用户的早期反应两极分化

GPT-4.5的发布在社交平台上引发了人工智能研究人员和技术爱好者的广泛讨论,尤其是在该模型的“系统卡”(即概述其训练和评估的技术文档)提前泄露后,文档中包含了一系列官方公告前的基准测试结果。

OpenAI在泄露后发布的最终版系统卡与泄露版本存在显著差异,删除了泄露版中“GPT-4.5并非前沿模型,但它是OpenAI最大的LLM,比GPT-4的计算效率提高了10倍以上”的表述。OpenAI的发言人表示,这一说法并不准确。

人工智能模型提供商Nous Research的联合创始人Teknium(化名)对OpenAI的新模型表示失望,指出在多语言理解(MMLU)和实际编码基准测试中,GPT-4.5相比其他领先的大语言模型(LLM)的改进微乎其微。Teknium质疑道:“距离GPT-4发布已经过去2年多,OpenAI投入的资金投入规模扩大上千倍……究竟发生了什么?”

此外,有人认为,GPT-4.5在软件工程基准测试中表现逊于o3-mini,这让人质疑此次发布是否代表了真正的技术进步。

然而,也有部分用户为GPT-4.5的潜力辩护,认为其价值不应仅仅依赖于基准测试的结果。

软件开发人员Haider(@slow_developer)强调,GPT-4.5相比GPT-4在计算效率上提升了10倍,并且其在综合任务处理能力上优于OpenAI专注于STEM领域的o系列模型。

AI新闻发布者Andrew Curran(@AndrewCurran_)则从定性角度出发,预测GPT-4.5将在写作和创造性思维领域树立新标准,并称其为OpenAI的“杰作”。

这些讨论凸显了人工智能领域一个更广泛的争论:技术进步是否应单纯通过基准测试来衡量,还是应更侧重于推理能力、创造力和拟人化交互等定性方面的改进?

仍处于研究预览阶段

OpenAI将GPT-4.5定位为研究预览版,以深入了解其优势与局限性。该公司表示,将继续探索用户与模型的互动方式,并挖掘非常规应用场景。

OpenAI称:“我们发布GPT-4.5作为研究预览版,以更好地了解其优势与局限性。扩展无监督学习将继续推动人工智能的进步,提升准确性、流畅性和可靠性。”

随着OpenAI不断改进其模型,GPT-4.5为未来的人工智能进步奠定了基础,尤其是在推理和工具使用代理方面。尽管GPT-4.5已经展示了令人印象深刻的能力,OpenAI仍在积极评估其在生态系统中的长期作用。

凭借更广泛的知识库、更高的情商和更自然的对话能力,GPT-4.5将为各个领域的用户带来显著改进。OpenAI期待看到开发者、企业和团队如何将该模型集成到他们的工作流程和应用中。

随着人工智能技术的不断进步,GPT-4.5标志着OpenAI在追求更强大、更可靠、更符合用户需求的语言模型道路上迈出了重要的一步,为企业领域的创新带来了新的机遇。(小小)

延伸阅读
相关推荐
热点推荐
冬至夜成都羊肉汤单价最高涨了20元:“氛围派”露天排队1小时,“务实派”买肉回家做

冬至夜成都羊肉汤单价最高涨了20元:“氛围派”露天排队1小时,“务实派”买肉回家做

封面新闻
2025-12-21 22:37:04
妹子买不到小猫合身的衣服,便开始自己做…我勒个百变小猫

妹子买不到小猫合身的衣服,便开始自己做…我勒个百变小猫

拜见喵主子
2025-12-21 12:22:22
利物浦赚翻了!9500万欧买到新托雷斯,4场5球有望称霸英超

利物浦赚翻了!9500万欧买到新托雷斯,4场5球有望称霸英超

锐评利物浦
2025-12-21 23:51:21
37岁福原爱宣布再婚怀孕,丈夫是他!交往之初未想结婚,男方一句话促成姻缘

37岁福原爱宣布再婚怀孕,丈夫是他!交往之初未想结婚,男方一句话促成姻缘

上观新闻
2025-12-22 11:42:08
腿粗屁股大的女生别乱穿!白色T恤搭配打底裤,休闲舒适又显身材

腿粗屁股大的女生别乱穿!白色T恤搭配打底裤,休闲舒适又显身材

小乔古装汉服
2025-12-21 19:59:56
演不了别尬演!《老舅》郭京飞女儿出戏,观众:看着像二胖的小姑

演不了别尬演!《老舅》郭京飞女儿出戏,观众:看着像二胖的小姑

娱乐故事
2025-12-20 21:02:44
特朗普够狠:美军突袭第2艘超级油轮,抢走中国购买的180万桶石油

特朗普够狠:美军突袭第2艘超级油轮,抢走中国购买的180万桶石油

南宫一二
2025-12-21 12:59:48
大量网友相信强力磁铁可让燃气表变慢,专家:窃气严重可刑事处罚

大量网友相信强力磁铁可让燃气表变慢,专家:窃气严重可刑事处罚

映射生活的身影
2025-12-20 03:39:27
牡丹花下死,“纵欲过度”的张雨绮,终究为自己的行为付出了代价

牡丹花下死,“纵欲过度”的张雨绮,终究为自己的行为付出了代价

娱乐看阿敞
2025-12-17 14:11:15
河南31岁新娘结婚,卸妆后改头换面判若两人,新郎:真想让她不卸妆

河南31岁新娘结婚,卸妆后改头换面判若两人,新郎:真想让她不卸妆

趣笔谈
2025-11-26 11:09:24
卫士手捧毛泽民画像,问毛主席认得吗?毛主席否认:像印度人一样

卫士手捧毛泽民画像,问毛主席认得吗?毛主席否认:像印度人一样

简史档案馆
2025-12-21 11:05:03
南博前院长被42人联名举报

南博前院长被42人联名举报

辣条小剧场
2025-12-22 05:50:38
长叹一声!1.45亿巨星疑腿部骨折:或缺阵数月 利物浦又得买前锋

长叹一声!1.45亿巨星疑腿部骨折:或缺阵数月 利物浦又得买前锋

风过乡
2025-12-22 06:48:09
iPhone20周年版曝光,刚买iPhone17的要哭了!

iPhone20周年版曝光,刚买iPhone17的要哭了!

小兔子发现大事情
2025-12-20 01:55:32
电动车新国标不“折腾”了!工信部回应诉求,速度后座都顺当了

电动车新国标不“折腾”了!工信部回应诉求,速度后座都顺当了

阿芒娱乐说
2025-12-21 13:04:00
蓉城引援信息泄露,泰山申花两大国脚成头号目标,还将更换三外援

蓉城引援信息泄露,泰山申花两大国脚成头号目标,还将更换三外援

体坛风之子
2025-12-22 07:00:05
时隔4年再掀风波!福原爱怀三胎被骂上热搜,日本网友:闭嘴吧!

时隔4年再掀风波!福原爱怀三胎被骂上热搜,日本网友:闭嘴吧!

阿废冷眼观察所
2025-12-22 11:40:11
超越篮球之神!40岁詹姆斯飙分,创两大神纪录

超越篮球之神!40岁詹姆斯飙分,创两大神纪录

体育妞世界
2025-12-21 21:02:24
比亚迪年底升职加薪

比亚迪年底升职加薪

蚂蚁大喇叭
2025-12-21 12:09:03
演员温峥嵘:已刑事立案

演员温峥嵘:已刑事立案

民间平哥
2025-12-19 15:40:45
2025-12-22 12:31:00

科技要闻

商汤联创亲自下场 痛批主流机器人技术大错

头条要闻

牛弹琴:泰柬冲突后 泰国在中国形象出现戏剧性转折

头条要闻

牛弹琴:泰柬冲突后 泰国在中国形象出现戏剧性转折

体育要闻

勇士火箭赢球:王牌之外的答案?

娱乐要闻

星光大赏看点全在台下

财经要闻

人民币快涨到7了!

汽车要闻

可享88元抵2000元等多重权益 昊铂A800开启盲订

态度原创

亲子
游戏
旅游
教育
公开课

亲子要闻

2025年换季护宝指南:皇家美素佳儿如何用黄金配方筑牢宝宝抵抗力?

Aspyr暗示《古墓丽影》重启三部曲或完整登陆Switch

旅游要闻

果然视频|阴有小雨,山区有雨夹雪,泰山暂停销售12月22日夜间至23日全天的线上门票

教育要闻

大英赛,你知道么,值得参加么!?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×