网易首页 > 网易科技 > 网易科技 > 正文

GPT-4.5发布:比GPT-4提升10倍 但"并非前沿模型"

0
分享至

2月28日消息,美国时间周四,OpenAI宣布推出GPT-4.5,这是其最新、最强大的大语言模型(LLM)的研究预览版,专为聊天应用设计。不过,这也是OpenAI迄今为止最昂贵的模型。

不过,GPT-4.5仍然是一款传统的大型语言模型,而非“推理模型”。此前,OpenAI、DeepSeek、Anthropic等公司都推出了推理模型,这些模型能够生成“思维链”或类似意识流的文本,通过反思自身的假设和结论,尝试在向用户提供响应或输出之前捕捉错误。

尽管如此,OpenAI联合创始人兼首席执行官山姆·奥特曼(Sam Altman)在社交平台上表示,GPT-4.5是“第一个让我感觉像是在与一个有思想的人交谈的模型。我曾多次靠在椅背上,惊讶于AI能给出真正有用的建议。”


奥特曼还提醒道,由于GPU供应紧张,OpenAI不得不限制对GPT-4.5的访问。他指出:“坏消息是:这是一个庞大且昂贵的模型。我们本打算同时向Plus和Pro用户推出,但用户量大幅增长导致GPU资源不足。我们计划下周增加数万颗GPU,并随后向Plus订阅用户开放。(很快还会有数十万颗GPU到位,我相信大家会充分利用我们部署的每一颗GPU。)这并不是我们理想的运作方式,但很难完美预测导致GPU短缺的需求激增。”

从美国时间周四开始,GPT-4.5将向OpenAI的最昂贵订阅服务ChatGPT Pro(每月200美元)的用户开放,并向所有付费API层级的开发者提供访问权限。OpenAI还计划在下周将其扩展至价格相对较低的Plus和Team层级(每月20/30美元)。

GPT-4.5支持搜索功能和画布模式,用户还可以上传文件和图像,但目前还不支持其他多模态功能,如语音模式、视频和屏幕共享——至少暂时不支持。

通过无监督学习推动AI进步

GPT-4.5代表了人工智能训练领域的显著进步,尤其是在无监督学习方面,这大大提升了模型识别模式、建立联系以及生成创造性见解的能力。

OpenAI的研究人员提到,GPT-4.5通过基于较小人工智能模型生成的数据进行训练,这有助于提升其“世界模型”。他们还表示,该模型同时利用多个数据中心进行预训练,这意味着它采用了一种类似于竞争对手Nous Research的去中心化方法。

这种训练方式显然帮助GPT-4.5学会了生成更自然、更直观的交互,同时更准确地遵循用户意图,并展现出更高的情商。该模型在OpenAI此前关于人工智能扩展的工作基础上取得了突破,进一步验证了“增加数据和计算能力有助于提升人工智能性能”的理念。

与前代模型及其他同类产品相比,GPT-4.5预计能够显著减少幻觉现象(幻觉率为37.1%,相比之下GPT-4为61.8%),从而使其在处理广泛话题时更加可靠。

GPT-4.5的突出特点

根据OpenAI的说法,GPT-4.5旨在创造亲切自然、直观流畅的对话。它对语义细微差异和上下文有更强的把握能力,能够实现更像人类之间的互动,并更有效地与用户协作。

GPT-4.5通过扩展的知识库和敏锐的细微线索解读能力,在多个领域展现出色表现,包括:

——写作辅助:优化内容、提升清晰度、激发创意

——编程支持:调试、提出代码改进建议、自动化工作流程

——问题解决:提供详细解释,并协助做出实际决策

此外,GPT-4.5还采用了新的对齐技术,增强了其对人类偏好和意图的理解能力,进一步提升了用户体验。

如何访问GPT-4.5?

从美国当地时间周四开始,ChatGPT Pro用户可以在网页、移动端和桌面端的模型选择菜单中选择GPT-4.5。OpenAI计划在下周将该模型扩展到Plus和Team用户。

对于开发者,GPT-4.5将通过OpenAI的API提供,包括Chat Completions API、Assistants API和Batch API。它支持函数调用、结构化输出、流式传输、系统消息和图像输入等关键功能,使其成为多种人工智能驱动应用的通用工具。不过,GPT-4.5目前尚不支持语音模式、视频或屏幕共享等多模态功能。

定价及对企业决策者的影响

企业和团队领导者可以充分利用GPT-4.5带来的各种功能。凭借较低的幻觉率、增强的可靠性和自然流畅的对话能力,GPT-4.5能够支持广泛的业务功能:

——改善客户互动:企业可以将GPT-4.5集成到支持系统中,以实现更快、更自然的互动,同时减少错误

——增强内容生成:营销和传播团队可以高效地制作高质量、符合品牌的内容

——精简运营:人工智能驱动的自动化可以帮助调试、优化工作流程并支持战略决策

——可扩展性和定制化:API允许企业进行量身定制,构建符合其特定需求的人工智能解决方案

然而,对于希望通过GPT-4.5构建应用的第三方开发者来说,GPT-4.5的API定价高得惊人,每百万输入/输出token的价格为75美元/180美元,而GPT-4o的定价仅为2.50美元/10美元。

随着其他竞争对手模型的发布——如Anthropic的Claude 3.7、Google的Gemini 2 Pro,以及OpenAI自家的推理“o”系列(o1、o3-mini High、o3)——GPT-4.5的性能提升是否足以抵消其高昂成本,特别是在通过API使用时,将成为一个值得关注的问题。

AI研究人员与资深用户的早期反应两极分化

GPT-4.5的发布在社交平台上引发了人工智能研究人员和技术爱好者的广泛讨论,尤其是在该模型的“系统卡”(即概述其训练和评估的技术文档)提前泄露后,文档中包含了一系列官方公告前的基准测试结果。

OpenAI在泄露后发布的最终版系统卡与泄露版本存在显著差异,删除了泄露版中“GPT-4.5并非前沿模型,但它是OpenAI最大的LLM,比GPT-4的计算效率提高了10倍以上”的表述。OpenAI的发言人表示,这一说法并不准确。

人工智能模型提供商Nous Research的联合创始人Teknium(化名)对OpenAI的新模型表示失望,指出在多语言理解(MMLU)和实际编码基准测试中,GPT-4.5相比其他领先的大语言模型(LLM)的改进微乎其微。Teknium质疑道:“距离GPT-4发布已经过去2年多,OpenAI投入的资金投入规模扩大上千倍……究竟发生了什么?”

此外,有人认为,GPT-4.5在软件工程基准测试中表现逊于o3-mini,这让人质疑此次发布是否代表了真正的技术进步。

然而,也有部分用户为GPT-4.5的潜力辩护,认为其价值不应仅仅依赖于基准测试的结果。

软件开发人员Haider(@slow_developer)强调,GPT-4.5相比GPT-4在计算效率上提升了10倍,并且其在综合任务处理能力上优于OpenAI专注于STEM领域的o系列模型。

AI新闻发布者Andrew Curran(@AndrewCurran_)则从定性角度出发,预测GPT-4.5将在写作和创造性思维领域树立新标准,并称其为OpenAI的“杰作”。

这些讨论凸显了人工智能领域一个更广泛的争论:技术进步是否应单纯通过基准测试来衡量,还是应更侧重于推理能力、创造力和拟人化交互等定性方面的改进?

仍处于研究预览阶段

OpenAI将GPT-4.5定位为研究预览版,以深入了解其优势与局限性。该公司表示,将继续探索用户与模型的互动方式,并挖掘非常规应用场景。

OpenAI称:“我们发布GPT-4.5作为研究预览版,以更好地了解其优势与局限性。扩展无监督学习将继续推动人工智能的进步,提升准确性、流畅性和可靠性。”

随着OpenAI不断改进其模型,GPT-4.5为未来的人工智能进步奠定了基础,尤其是在推理和工具使用代理方面。尽管GPT-4.5已经展示了令人印象深刻的能力,OpenAI仍在积极评估其在生态系统中的长期作用。

凭借更广泛的知识库、更高的情商和更自然的对话能力,GPT-4.5将为各个领域的用户带来显著改进。OpenAI期待看到开发者、企业和团队如何将该模型集成到他们的工作流程和应用中。

随着人工智能技术的不断进步,GPT-4.5标志着OpenAI在追求更强大、更可靠、更符合用户需求的语言模型道路上迈出了重要的一步,为企业领域的创新带来了新的机遇。(小小)

延伸阅读
相关推荐
热点推荐
娶15岁娇妻,只为与36岁岳母偷情的卢芹斋,为何让人又爱又恨?

娶15岁娇妻,只为与36岁岳母偷情的卢芹斋,为何让人又爱又恨?

云霄纪史观
2025-12-19 19:20:10
中国游客不去了,日本街头反倒更吵了,转而抱怨欧美游客素质低

中国游客不去了,日本街头反倒更吵了,转而抱怨欧美游客素质低

老特有话说
2025-12-19 17:56:16
真惨,新股上市就跌去三分之一,一中签股民从盈利3.1万到亏3.3万

真惨,新股上市就跌去三分之一,一中签股民从盈利3.1万到亏3.3万

财经智多星
2025-11-09 16:14:47
新疆86-92吉林 球员评价:5人及格,7人低迷

新疆86-92吉林 球员评价:5人及格,7人低迷

篮球资讯达人
2025-12-21 02:18:40
健身教练傍45岁已婚富婆同游泰国,照片围猎手段被曝:四肢发达头脑不简单

健身教练傍45岁已婚富婆同游泰国,照片围猎手段被曝:四肢发达头脑不简单

不二表姐
2025-12-18 22:36:50
放弃争夺数百亿遗产,带着女儿远遁美国,如今才知道她有多清醒

放弃争夺数百亿遗产,带着女儿远遁美国,如今才知道她有多清醒

梦史
2025-12-16 11:07:49
奉劝大家:这9样生活用品,别买“太便宜”的,越便宜越容易吃亏

奉劝大家:这9样生活用品,别买“太便宜”的,越便宜越容易吃亏

抠搜侠
2025-12-20 16:57:15
贺江川落马,在北京国企圈子里,妥妥是金字塔尖的大佬。

贺江川落马,在北京国企圈子里,妥妥是金字塔尖的大佬。

百态人间
2025-12-19 16:54:12
《科学》重磅!刚刚,固态电池技术重大突破!状态无关电解质问世

《科学》重磅!刚刚,固态电池技术重大突破!状态无关电解质问世

徐德文科学频道
2025-12-20 22:55:23
有事求中国,无事卖中国!如何应对两面派邻国?3招可化解于无形

有事求中国,无事卖中国!如何应对两面派邻国?3招可化解于无形

何氽简史
2025-11-29 17:41:48
张柏芝不再隐瞒,三胎生父早有答案,难怪谢霆锋又和王菲在一起了

张柏芝不再隐瞒,三胎生父早有答案,难怪谢霆锋又和王菲在一起了

可乐谈情感
2025-12-21 00:58:01
泰军炸掉诈骗园区、器官移植中心,洪森为何气急败坏?

泰军炸掉诈骗园区、器官移植中心,洪森为何气急败坏?

胡严乱语
2025-12-16 20:33:51
又打起来了?美军深夜开火,特朗普开始下令,拜登默克尔重出江湖

又打起来了?美军深夜开火,特朗普开始下令,拜登默克尔重出江湖

健身狂人
2025-12-21 05:54:19
三胎生父有眉目了!已立好遗嘱的张柏芝,让谢霆锋父子甩掉大黑锅

三胎生父有眉目了!已立好遗嘱的张柏芝,让谢霆锋父子甩掉大黑锅

李橑在北漂
2025-12-21 06:20:28
黎智英女儿叫嚣,如果她父亲能够获释,他会把重心放在家庭上

黎智英女儿叫嚣,如果她父亲能够获释,他会把重心放在家庭上

百态人间
2025-12-20 05:25:03
里贝里:有次与卡瓦哈尔起冲突后,佩佩拉莫斯想把我“杀”了

里贝里:有次与卡瓦哈尔起冲突后,佩佩拉莫斯想把我“杀”了

懂球帝
2025-12-20 22:47:14
董璇自爆全年都穿一次性内裤,一条100多块,网友集体破防

董璇自爆全年都穿一次性内裤,一条100多块,网友集体破防

星创文化
2025-12-01 22:54:08
NBA官宣罚单:斯马特中场向裁判竖中指 被处以3.5万美元罚款

NBA官宣罚单:斯马特中场向裁判竖中指 被处以3.5万美元罚款

罗说NBA
2025-12-21 05:57:38
6国已派兵过南海,菲防长通告中国,不许出手,中方直接喷射水炮

6国已派兵过南海,菲防长通告中国,不许出手,中方直接喷射水炮

谛听骨语本尊
2025-12-18 16:17:58
柬埔寨渐行渐远,洪玛奈路线亲美,西哈莫尼国王有名无权未婚无子

柬埔寨渐行渐远,洪玛奈路线亲美,西哈莫尼国王有名无权未婚无子

乐天闲聊
2025-12-20 10:20:01
2025-12-21 07:32:49

科技要闻

许四清:具身智能的"ChatGPT时刻"还未到来

头条要闻

高市早苗要赶在特朗普访华前行动 以免被中美边缘化

头条要闻

高市早苗要赶在特朗普访华前行动 以免被中美边缘化

体育要闻

我开了20年大巴,现在是一名西甲主帅

娱乐要闻

2026央视跨年晚会阵容曝光,豪华阵仗

财经要闻

求解“地方财政困难”

汽车要闻

岚图推进L3量产测试 已完成11万公里实际道路验证

态度原创

房产
本地
手机
亲子
军事航空

房产要闻

广州有态度,一座国际化社区给出的城市答案

本地新闻

云游安徽|访黄山云海古村,读一城山水风骨

手机要闻

小米REDMI Note 15系列手机新春版现身,元旦发售

亲子要闻

张柏芝小儿子罕见露脸,网友惊呼太像妈妈,三个儿子各有千秋

军事要闻

泽连斯基:前线局势愈发艰难

无障碍浏览 进入关怀版
×