网易首页 > 网易号 > 正文 申请入驻

专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破

0
分享至

本文作者:杜玉

来源:硬AI

9月10日周二,据知名科技商业类媒体The Information援引多位测试过该模型的人士透露,站在时代风口浪尖的“AI宠儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品,作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季发布”(9月至11月)要更早。

上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月被市场期待已久的草莓项目,来恢复ChatGPT首发以来两年里大部分时间的势头。

何为“草莓”模型?专注于推理能力,是人工智能下一个重大突破

两周前曾有消息称,OpenAI加速推出“草莓”推理人工智能模型,以推动聊天机器人业务。四周前的消息称,著名AI搜索公司perplexity CEO暗示已经提前用上了OpenAI的最新模型“草莓”。

华尔街见闻曾提到,早在5月时就有传闻称OpenAI正在神秘开发代号为“草莓”的项目。两个月前的7月13日,又有消息确认“草莓”是OpenAI正在开发新的人工智能模型,希望提供更高级推理能力以形成迈向通用人工智能(AGI)的重大突破。

具体来说,“草莓”模型凭借增强的推理能力,能够更好地处理令以往AI模型“挠头”的复杂科学和数学问题,不仅能让大语言模型(LLM)根据用户的复杂查询生成答案,甚至还能提前规划,以便自主、可靠地浏览互联网,进行OpenAI 定义的“深度研究”(deep research)。

评论普遍认为,OpenAI的“草莓计划”有望成为人工智能下一个重大突破。更先进的推理能力意味着该技术可以“自主”执行更复杂任务,而不仅仅是依靠用户的逐步提示行事。推理一直是AI在类人智能追求中最棘手的问题之一,而具有推理能力的人工智能模型不仅能改善数学和编程能力,还可以彻底改变科学研究,增强医疗保健和金融等复杂领域的决策力,并加速技术创新。

会显著更贵吗?“草莓”模型具体的提供形式和定价模式尚不确定

据悉,“草莓”发布后虽然整体作为ChatGPT的一部分,但也是一项独立产品,可能会纳入客户选择以支持ChatGPT运行的AI模型下拉菜单中,但具体的提供形式和定价模式都尚不确定。

与常规的对话式人工智能不同,“草莓”在回应用户的提示语之前会“思考”10到20秒,而不是立即给出答案。对于复杂或包含多个执行步骤要求的查询语,“草莓”将比现有的GPT-4o版本更易于使用,不需要用户明确告知ChatGPT“完成中间推理步骤以得出最终答案”等额外举动。

有分析称,这意味着“草莓”将成为更加智能的助手,不仅在解决数学问题和编码方面表现更佳,在更“主观”的商业任务方面也更优秀,比如集思广益制定产品营销策略等。而且在这类偏创意的任务中,该模型将提供更针对用户公司需求、更详细的建议,比如生成每周执行计划。

不过,假设发布一切顺利,在初始版本“草莓”只能接收和生成文本信息,而不能接收和生成图像,这代表不像其他OpenAI模型那样具备“多模态”功能,算是“缺点”之一。

同时,尽管“思考”阶段有助于避免AI犯错、且能预测如何全面回答用户问题,但有测试过该模型的人士称,一些简单问题也会令草莓“思考”而无法迅速给出答案;答案质量仅略佳,不值得额外等待;而且有时无法在回答新问题之前记住并整合与用户的先前聊天记录。

在定价方面,上周曾有消息称,ChatGPT Plus当前付费价格是每月20美元,但OpenAI考虑将“草莓”和被外界誉为“ChatGPT 5”的“猎户座”(Orion)等全新大模型拟定在月付2000美元,等于定价提升100倍。分析认为,OpenAI能考虑如此高的价格跨度,主要是因为缺钱、新产品足够强以及手握数亿用户。

“草莓”模型为何重要?或重新定义AI能力边界,为GPT 5提供高质量合成训练数据

OpenAI首席执行官奥特曼(Sam Altman)曾在今年早些时候表示,人工智能领域“最重要的进步方向将是推理能力”。

而“草莓”项目被认为就是去年披露出的OpenAI“Q*”计划,该项目在公司内部已被视为一项突破。观看过演示的人称能够回答当前商用AI模型无法解决的棘手科学和数学问题。

OpenAI曾在8月11日给出了未来AI发展的五个阶段路线图,第一阶段便是现在具有对话语言的AI聊天机器人,第二阶段是具有人类水平问题解决能力的“推理者”,第三阶段是可以采取自主行动的“代理人”(AI agent),随后是可协助发明的“创新者”和可完成组织工作的“组织者”。

而“草莓”极可能是帮助OpenAI实现第二级AI的关键,一旦成功将重新定义AI的能力边界,自主执行复杂任务、独立解决复杂问题并验证输出内容,代表人类离通用人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。

软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出,借助“草莓”项目,OpenAI对人类推理水平的追求不仅是技术奇迹,更能突破界限、激发每个领域新的可能性。比如在商业领域,人工智能将能极大地改变供应链的管理方式,非常准确地预测市场趋势,并在很大程度上使客户体验非常个性化。

而在普通用户的层面,其使用体验也会有所改进,例如具有推理能力的AI模型不仅能提供更优化的旅行计划和健康建议,甚至可以分析用户的消费习惯并创建完全定制化的预算方案,做更智能的助手。

总而言之,在理想化的情况下,“草莓”将能够解决超出当前人工智能模型能力范围的问题和任务,并进行“深入研究”,“比任何现有的聊天机器人都更胜一筹”。

还有分析指出,“草莓”计划旨在筹集更多资金,OpenAI需要这笔钱来支持代号为“猎户座”的下一代前沿模型开发。而且,为“猎户座”模型生成高质量的合成训练数据被认为是“草莓”的关键应用之一,“这一点意义重大,因为互联网上的大部分训练数据都已被使用殆尽”:

人工智能模型所依赖的大型数据集可能容易出现偏差和错误,或者包含不完整或不准确的信息。草莓计划生成的高质量合成数据可以填补现实世界数据集的空白,并提供更全面、更包容、更平衡的训练集。
许多人认为,使用合成数据可以帮助未来的人工智能模型更加中立和公平,并减少噪音、幻觉和不相关的信息,从而提高训练的效率和模型的准确性。
根据已知的信息,草莓计划改进了推理、逻辑以及规划和开展研究的能力,可以让模型自主进行实验、分析数据并提出新的假设。这可能会带来科学突破,包括发现新药。这些模型还可以提供个性化教育,创建教育内容和互动课程。

据知情人士透露,“草莓”项目包括一种专门的“后训练”方法,即生成式AI模型已经过大量数据集上进行预训练后,进一步调整模型以提高其在特定任务上的表现。这类似于斯坦福大学在2022年开发的“自学推理者”(Self-Taught Reasoner,简称STaR)方法。

STaR创造者之一、斯坦福大学教授Noah Goodman曾表示,STaR可以让AI模型通过迭代创建自有训练数据,“引导 ”自己进入更高的智能水平,理论上可用来让语言模型实现超越人类的智能。但他也承认,“这既令人兴奋又令人恐惧,人类(应就自身处境)需要认真思考一些问题了。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈法拉同时登上时尚杂志不同地区封面——自我实力的又一次展现

陈法拉同时登上时尚杂志不同地区封面——自我实力的又一次展现

雅儿姐游世界
2026-02-14 13:30:21
倪萍:父亲到死我都没喊他一声“爸”,母亲的仇恨教育刻骨铭心

倪萍:父亲到死我都没喊他一声“爸”,母亲的仇恨教育刻骨铭心

白面书誏
2025-11-22 17:18:59
全国上千万满族人,满语满文怎么还这么快就要消亡了?

全国上千万满族人,满语满文怎么还这么快就要消亡了?

历史按察使司
2026-02-14 08:00:03
上海大叔55岁未婚,住垃圾堆却要穿名牌,打开冰箱后才知啥叫生活

上海大叔55岁未婚,住垃圾堆却要穿名牌,打开冰箱后才知啥叫生活

寒士之言本尊
2025-09-08 23:20:45
菲律宾博主为流量吃剧毒魔鬼蟹,2天后身亡,尸体嘴唇呈深蓝色

菲律宾博主为流量吃剧毒魔鬼蟹,2天后身亡,尸体嘴唇呈深蓝色

狸猫之一的动物圈
2026-02-14 11:42:30
59岁宋祖英现身活动状态惊艳!短发利落大气,黑色套装优雅端庄

59岁宋祖英现身活动状态惊艳!短发利落大气,黑色套装优雅端庄

琴声飞扬
2026-02-12 11:51:25
库里致敬保罗:只想说声恭喜,这是一段不可思议的职业生涯

库里致敬保罗:只想说声恭喜,这是一段不可思议的职业生涯

懂球帝
2026-02-14 12:55:04
4 大新升级!新 iPhone 官宣:2月19日,即将发布

4 大新升级!新 iPhone 官宣:2月19日,即将发布

科技堡垒
2026-02-14 10:29:51
1万人看傻!花滑超级冷门:世界第1噩梦2次摔倒+3次跳空 仅排第8

1万人看傻!花滑超级冷门:世界第1噩梦2次摔倒+3次跳空 仅排第8

风过乡
2026-02-14 08:10:07
别被马斯克忽悠了!星链撑不起人类通讯,中国通信基建才是底气

别被马斯克忽悠了!星链撑不起人类通讯,中国通信基建才是底气

像梦一场a
2026-02-13 20:20:26
59年,左大玢指出毛主席念错自己名字,主席笑道:回去问问你爸爸

59年,左大玢指出毛主席念错自己名字,主席笑道:回去问问你爸爸

叹为观止易
2026-02-03 14:15:30
联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

原来仙女不讲理
2026-02-13 17:31:20
美媒最佳新秀TOP5!杨瀚森交易筹码压线入选 康神弗拉格双星争ROY

美媒最佳新秀TOP5!杨瀚森交易筹码压线入选 康神弗拉格双星争ROY

锅子篮球
2026-02-13 21:18:08
33岁内马尔官宣当爷爷!4娃3母情史混乱,绯闻频登热搜引热议

33岁内马尔官宣当爷爷!4娃3母情史混乱,绯闻频登热搜引热议

罗氏八卦
2026-02-13 18:55:03
1955年一将军嫌军衔太低,大闹总政处,扬言:粟裕都得叫我老排长

1955年一将军嫌军衔太低,大闹总政处,扬言:粟裕都得叫我老排长

抽象派大师
2025-12-16 17:52:39
就在刚刚!官宣第7位主帅下课!广东更换主场,场均29分外援回CBA

就在刚刚!官宣第7位主帅下课!广东更换主场,场均29分外援回CBA

老吴说体育
2026-02-13 23:33:46
中国再次抛售美债,不会再救美元,特朗普只能承认自己犯下大错

中国再次抛售美债,不会再救美元,特朗普只能承认自己犯下大错

独坐山巅前
2026-02-13 20:35:22
中央戏剧学院王鑫主动投案,从通报里可以读出什么?

中央戏剧学院王鑫主动投案,从通报里可以读出什么?

推石头的林律师
2026-02-13 17:54:29
你见过最土的土豪有多土?网友:你这明显是短剧看多了

你见过最土的土豪有多土?网友:你这明显是短剧看多了

带你感受人间冷暖
2026-02-11 11:21:06
2月13日译名发布:“火烈鸟”导弹

2月13日译名发布:“火烈鸟”导弹

参考消息
2026-02-13 13:48:41
2026-02-14 14:47:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
141779文章数 2652539关注度
往期回顾 全部

科技要闻

独家探访蔡磊:答不完的卷子 死磕最后一程

头条要闻

百果园一根甘蔗87元被吐槽贵 店员:黄金手撕甘蔗按斤卖

头条要闻

百果园一根甘蔗87元被吐槽贵 店员:黄金手撕甘蔗按斤卖

体育要闻

一年怒亏2个亿,库里和安德玛的“孽缘”

娱乐要闻

吴克群变“吴克穷”助农,国台办点赞

财经要闻

春节抢黄金,谁赚到钱了?

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

房产
家居
旅游
艺术
教育

房产要闻

三亚新机场,又传出新消息!

家居要闻

中古雅韵 乐韵伴日常

旅游要闻

外媒说丨春节极具国际吸引力,中国入境游火热

艺术要闻

石墙上的毛主席诗词引发热议,60字作品背后高人是谁?

教育要闻

教育部定调2026年高考,6大变化恐深度影响考生命运

无障碍浏览 进入关怀版