网易首页 > 网易号 > 正文 申请入驻

从GPT到"草莓":OpenAI的野心与安全困境

0
分享至

每经记者:文巧 每经实习记者:岳楚鹏 每经编辑:高涵

此前,一道低难度的数学题——9.11和9.9哪个更大,难倒了一众海内外AI大模型,也让外界了解到了大模型在推理方面的局限性。

不过,情况正在迅速发生改变。当地时间8月27日,据The Information报道,OpenAI神秘“草莓”(Strawberry,前身为Q*)项目,计划最早于今年秋季推出。同时,用“草莓”合成数据来开发的最新大模型——“猎户座”(Orion),或于明年年初推出。

据悉,“草莓”是一个推理模型,有着强大的推理能力,可处理复杂的问题;“猎户座”则是超越GPT-4的下一代大模型,可帮助OpenAI减少其模型产生的错误数量,即所谓的幻觉。

据The Information援引知情人士称,今年夏天,在秘密会议上,OpenAI向美国国家安全官员展示了“草莓”模型。报道指出,OpenAI向政府展示一项尚未发布的技术,可能为人工智能开发者树立新标准,也是OpenAI努力向政策制定者提高透明度的一部分。此前,以伊丽莎白·沃伦为首的美国参议员们曾多次抨击OpenAI项目透明度和安全性问题。

图片来源:每日经济新闻 资料图


推理能力出众,“草莓”能为OpenAI创收吗?

据The Information报道,参与OpenAI该项目的两名人员透露,研究人员计划在今年秋季推出代号为“草莓”的新型 AI,并有可能将其作为ChatGPT的一部分。

据悉,OpenAI希望通过推出“草莓”为公司筹集更多资金,并寻找减少亏损的方法。此前,据媒体报道OpenAI今年的亏损可能高达50亿美元。

《每日经济新闻》记者注意到,自2019年以来,OpenAI已从微软筹集了约130亿美元资金。作为与这家企业软件巨头合作的一部分,该合作协议将持续到2030年。据知情人士透露,合作协议的条款可能会发生变化,包括OpenAI向微软支付租用云服务器开发AI的费用,其中,云服务器是OpenAI最大的成本。

据前述外媒援引内部人士说法,“草莓”目前的功能极其强大——它可以解决此前从未见过的数学问题,这是当前的聊天机器人无法可靠完成的任务。它还可以解决涉及编程的问题,且不局限于回答技术性问题。如果给予更多时间“思考”,“草莓”模型还可以回答用户更“主观”的问题,例如产品营销策略。

为了展示“草莓”在语言方面的实力,研究人员向OpenAI内部同事展示了“草莓”如何解决《纽约时报》上刊登的复杂字谜游戏。

事实上,现有的人工智能在航空航天和结构工程等数学密集型领域并不擅长,那么,解决棘手数学问题的AI可能是一个潜在有利可图的应用。为了提高模型的推理能力,一些初创公司尝试使用一种别扭的解决办法——将问题分解为更小的步骤,但这些办法既慢又贵。

数学推理的改进也有助于AI模型更好地处理对话查询,例如客户服务请求。这或许对OpenAI即将推出的AI代理服务起到帮助。

不仅是OpenAI,人工智能领域的其他主要参与者也在数学推理方面取得了长足进步。例如,谷歌DeepMind 最近开发了AlphaProof和AlphaGeometry 2,这是两个用于高级数学推理的AI系统。两个系统协同工作,在2024年国际数学奥林匹克竞赛中获得银牌,解决了六道题中的四道。


“草莓”正在为下一代旗舰模型猎户座提供训练数据

在OpenAI内部,“草莓”不仅是一个即将要向外界推出的商业模型,它还被赋予了更重要的使命。

一位知情人士向The Information表示,OpenAI在使用更大版本的“草莓”来生成训练下一代旗舰模型“猎户座”(Orion)的数据。该模型旨在改进其现有的旗舰模型GPT-4并帮助OpenAI领先其他资金雄厚的竞争对手,争夺对话式AI或大型语言模型的霸主地位。

GPT-4自2023年3月推出后,就成为了一个改变游戏规则的大型语言模型。然而,在过去18个月中,竞争对手已基本追赶上来。在某些情况下,甚至超越了OpenAI的最新模型。

基于聊天机器人竞技场的数学表现 图片来源:lmarena.ai

据知情人士表示,这种由人工智能生成的数据被称为“合成数据”。这意味着“草莓”可以帮助OpenAI克服获取足够高质量数据的限制,从而利用从互联网上提取的文本或图像等现实世界数据来训练新模型。

代理初创公司Minion AI CEO、GitHub Copilot前首席架构师亚历克斯·格雷夫利表示,使用“草莓”生成更高质量的训练数据可以帮助OpenAI减少其模型产生的错误数量,即所谓的幻觉。幻觉是当前生成式AI的一个重大限制,这会导致AI经常生成看似合理但实际上不正确的数据。

“想象一下,一个没有幻觉的模型,你问它一个逻辑难题,它第一次尝试就能答对,”格雷夫利说道。该模型之所以能够做到这一点,是因为“训练数据中的歧义较少,所以它猜测的次数较少。”

据The Information报道,奥特曼在5月份的一次活动中表示:“我们觉得我们拥有足够的数据来开发下一个模型。我们已经进行了各种实验,包括生成合成数据。”据报道,他可能指的就是用“草莓”训练的Orion(猎户座)。


安全隐患乌云未散

不过,就在OpenAI高歌猛进的同时,安全隐患的乌云从未散去。

“草莓”项目源于前OpenAI首席科学家Ilya Sutskever的早期研究,OpenAI研究人员Jakub Pachocki和Szymon Sidor在Sutskever的工作基础上开发了一种新的数学求解模型Q*。

而2023年底,有关OpenAI的Q*项目的消息泄露时,一些专家将该技术定性为人工智能(AGI)的突破,但人们对它知之甚少。这也让一些专注于人工智能安全的研究人员感到震惊。

这件事情发生在OpenAI罢免奥特曼之前,据知情人士爆料,此前员工之间就公司是否以足够安全的方式开发人工智能展开了争论。安全也是罢免奥特曼后公司内部损害控制的一个重要主题,当时罢免的发起人正是Sutskever。

此后,安全问题就一直困扰着OpenAI。而在奥特曼重返OpenAI后,负责OpenAI安全团队的成员也相继离开了公司。

今年5月离职的OpenAI“超级对齐”团队领导人Jan Leike在社媒平台X上写道:“过去几年,安全文化和流程已经退居次要地位,而闪亮的产品则成为重中之重。”

鉴于今年早些时候几位安全领导人离职,以及参议员伊丽莎白·沃伦等美国政府高官对于技术安全的批评,OpenAI决定提升对政府官员的透明度。

据The Information援引一位了解相关会议情况的人士透露,今年夏天,在一些并未公开的会议上,奥特曼的团队向美国国家安全官员展示了“草莓”模型。

报道指出,通过向政府官员展示一项尚未发布的技术,OpenAI可能为人工智能开发者树立了新标准,尤其是在先进人工智能日益成为潜在安全隐患的今天。此次演示可能是OpenAI努力向政策制定者提高透明度的一部分,但如果政策制定者认为该项技术形成威胁,那么他们可能给公司带来麻烦。

不过一些业界人士对此并不买账,因为OpenAI并未向公众提升透明度。AI初创公司Abacus.AI CEO Bindu Reddy表示,封闭的OpenAI将他们最好的大模型藏在背后,以此来取得领先优势。“如果没有开源AI,我们都会完蛋,我们可能会把文明的控制权交给1到2家公司。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
文班亚马创造历史!马刺喜提50胜!NBA要变天了

文班亚马创造历史!马刺喜提50胜!NBA要变天了

世界体育圈
2026-03-17 16:47:51
卧擦!NBA要大变天,詹姆斯必须退役了

卧擦!NBA要大变天,詹姆斯必须退役了

体育新角度
2026-03-17 21:03:50
古巴抗议愈演愈烈,释放多名囚犯,承认和美国对话

古巴抗议愈演愈烈,释放多名囚犯,承认和美国对话

昊轩看世界
2026-03-16 15:46:42
NBA官宣周最佳球员:东契奇场均37+10+11 阿德巴约创单场83分神迹

NBA官宣周最佳球员:东契奇场均37+10+11 阿德巴约创单场83分神迹

罗说NBA
2026-03-17 04:54:01
金价一夜大变天!今日金价(2026年3月17日)今日黄金价格多少钱一克最新查询

金价一夜大变天!今日金价(2026年3月17日)今日黄金价格多少钱一克最新查询

白浅娱乐聊
2026-03-17 11:25:04
人口告别世界第一?二孩催生无效后,国家终于向住房出手了

人口告别世界第一?二孩催生无效后,国家终于向住房出手了

猪小艳吖
2026-03-16 19:59:46
好利来的员工,很像空姐。

好利来的员工,很像空姐。

笔墨V
2026-03-16 00:03:37
他是红军高级将领,八路军成立时遭排挤,毛主席大怒:这是胡闹!

他是红军高级将领,八路军成立时遭排挤,毛主席大怒:这是胡闹!

饭小妹说历史
2026-03-17 11:01:06
局地8级以上!北京发布大风蓝警→

局地8级以上!北京发布大风蓝警→

BRTV新闻
2026-03-17 18:05:06
Shams实锤!詹姆斯下赛季去留,全看湖人本赛季能够走多远!

Shams实锤!詹姆斯下赛季去留,全看湖人本赛季能够走多远!

田先生篮球
2026-03-16 21:32:02
刚提半年 Model Y 首次出险,特斯拉车主:维修费高得离谱,要 3.5 万元多

刚提半年 Model Y 首次出险,特斯拉车主:维修费高得离谱,要 3.5 万元多

新浪财经
2026-03-16 13:53:43
伊朗警告日本:若日本境内美军基地被用于攻击伊朗,将对日本发动攻击

伊朗警告日本:若日本境内美军基地被用于攻击伊朗,将对日本发动攻击

大风新闻
2026-03-17 08:44:03
F1多了个“中国女婿”,车手阿尔本官宣在四川办婚礼

F1多了个“中国女婿”,车手阿尔本官宣在四川办婚礼

热点科技
2026-03-17 18:10:40
巴铁越打越猛,阿富汗电话打到北京,请中国出山,中方斩钉截铁

巴铁越打越猛,阿富汗电话打到北京,请中国出山,中方斩钉截铁

健身狂人
2026-03-17 11:14:27
最后期限已过!祝融号没被唤醒,但天问一号还在传回火星照片!

最后期限已过!祝融号没被唤醒,但天问一号还在传回火星照片!

火星一号
2026-03-16 01:00:53
建议40岁男人:鞋子“买对不买贵”,这3个品牌不输耐克、阿迪

建议40岁男人:鞋子“买对不买贵”,这3个品牌不输耐克、阿迪

冒泡泡的鱼儿
2026-03-16 14:55:56
中国女足急速扳平!张琳艳点球破门,亚洲杯第2球,两届连破韩澳

中国女足急速扳平!张琳艳点球破门,亚洲杯第2球,两届连破韩澳

奥拜尔
2026-03-17 18:31:20
卧擦!70亿,詹姆斯要做老板...

卧擦!70亿,詹姆斯要做老板...

体育新角度
2026-03-17 12:31:01
被网友的“花盆”惊到了,思路打开后,什么都能当花盆用

被网友的“花盆”惊到了,思路打开后,什么都能当花盆用

美家指南
2026-03-17 15:40:10
忠告!四种“垃圾食品”已公布,燕麦排第二,第一名很多人都喜欢

忠告!四种“垃圾食品”已公布,燕麦排第二,第一名很多人都喜欢

小舟谈历史
2025-10-17 09:33:31
2026-03-17 22:31:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1509831文章数 2724183关注度
往期回顾 全部

科技要闻

3万字实录|黄仁勋:每家公司都必须懂养虾

头条要闻

特朗普访华可能重新安排到什么时间 外交部回应

头条要闻

特朗普访华可能重新安排到什么时间 外交部回应

体育要闻

那个男人34岁拒绝买断 他要给状元当导师

娱乐要闻

姚晨曹郁发离婚声明 凌潇肃评论区沦陷

财经要闻

多款药品被曝线上线下价差巨大

汽车要闻

10分钟电量20%→97% 低温实测比亚迪闪充

态度原创

艺术
本地
时尚
数码
公开课

艺术要闻

捐赠文物3900余件,六莹堂主何许人也?

本地新闻

春天出门像出舱?一个过敏星人的装备进化史

优雅,与皱纹无关

数码要闻

米家扫拖机器人6 Max定档3月19日开售 可跨越6cm障碍

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版