网易首页 > 网易号 > 正文 申请入驻

OpenAI蹿稀式更新,200刀一个月的完整版o1你心动了吗

0
分享至

提前过年了。

OpenAI昨天在X上发推文,说从12月5日开始,要进行为期十二天的发布会,美国西部时间每天上午十点,每天挤一点点牙膏。

这个配置非常像美国流行的圣诞倒数日历,每天开一个小奖,有一个小惊喜,直到节日来临。

“12天,12场直播,一堆新玩意儿,有大有小”|还说不是圣诞礼盒!

OpenAI CEO萨姆·奥尔特曼(Sam Altman)前几天也在《纽约时报》DealBook峰会上给活动预热。“我们准备了很多新的、很棒的东西,”奥尔特曼说,“在接下来的12个工作日里,我们每天都会发布一个新功能,或者进行一次演示。”

据媒体透露的信息,这12天的发表内容包括之前大火的文本转视频AI Sora的升级版,和ChatGPT的agent版(也就是能处理特定任务的“披皮”ChatGPT),和推理模型o1的完全体。

在此之前,OpenAI好像很久都没有大动作了,距离Sora的第一次亮相已经过去了294天,距离ChatGPT语音版发布已经过去了205天,o1前瞻版的发布也已经是九月的事了。

第一天的内容有这些

今天凌晨,我们围观了12天发布会的第一炮。这个发布会很短,不到二十分钟就结束了。

发布会气氛很轻松随意,像家庭聚会,参与者除了奥尔特曼本人,还包括科学家 Hyung Won Chung(左二),他是o1模型的核心作者,在MIT取得了能源方向的博士学位,目前是OpenAI的研究科学家。右二和右一分别是Max Schwarzer和o1最引人注目的改进“思维链”的提出者Jason Wei。

这场发布会上主要更新的内容有两个:放出o1完全体,推出每月200美元的ChatGPT Pro。ChatGPT Pro可以无限制访问o1完全体。

o1完全体

OpenAI在9月发布了,跟之前的大模型不一样的是,o1牺牲了速度,展示了思维链,能做更复杂的深度思考。在过去的三个月里,我们一直没有见到o1的完整形态,前瞻版也只能供付费用户使用。现在完全版终于来了。

Max Schwarzer表示,比起前瞻版,o1完整版速度更快,正确率更高,更加智能,不会对每个问题都想老半天。

他说:“我们对这个模型进行了一系列非常详细的人工评估,我们发现,它犯重大错误的次数比o1预览版减少了约34%,同时充分思考的速度却提高了约 50%。

在发布会上他们现场演示了三个例子。

Schwarzer是历史爱好者,他问了o1和o1前瞻版同一个问题,让它们列出公元二世纪的罗马皇帝,讲一下他们的在位年代和功绩。这个问题不难,但是GPT-4o经常给出错误答案。

左侧是o1,右侧是o1前瞻版|OpenAI

在现场的演示中,两个模型都给出了正确答案,但是o1只用了14秒就给出了答案,o1前瞻版用了33秒。

“同样的问题我离线测试了几次,发现o1平均比o1预览版快60%。”Schwarzer说。

第二个例子是Hyung Won Chung演示的多模态功能。

作为热力学博士,Hyung Won Chung手绘了一张在太空里建数据中心的示意图,在这个设计里,数据中心靠巨大的太阳能板获取能量,然后靠散热板冷却GPU。

Hyung Won Chung给o1出的题是,这个数据中心功率是一千兆瓦,要让数据中心正常运转,冷却板的最小面积是多少?

o1发现这个问题里没有说明冷却的温度是多少,它按照常识把温度设定为室温,然后迅速算出了冷却板的面积是242万平方米。

第三个例子是Jason Wei演示的,他让o1找到符合描述的蛋白质。之前的o1前瞻版没法回答这个问题。

Wei给了o1六个标准,每一个标准都需要调用特定领域的化学知识,可能有很多蛋白质符合这些,所以o1需要评估所有候选项,然后对照六个标准一条一条进行检验。

最终o1在53秒后给出了正确答案,还展示了思维过程。

这三个例子分别展示了o1速度上的提升、强大的多模态功能,和深度思考能力的提高。

实测解几何题能力大大提高

我们第一时间用o1完全版做了测试。

先问了一个初中物理题,以下三组中,哪个提起重物所需的力最小?

o1几乎秒给答案,还把思考路径写了出来,详细到能做习题辅导。

第二个是逻辑推理题,需要按照规律填出缺失的数字,令人联想到一些考公题。

这道题o1想了1分41秒,也给出了正确答案,思考过程如下:

在直播的最后,奥尔特曼说,ChatGPT Pro后续还会推出更多功能,比如网页浏览,文件上传,函数调用等,明天的直播内容主要是面对开发者的一些更新。

作者:翻翻、Steed

封面图来源:OpenAI

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苹果加它一起煮,效果很大,一润肺、二止咳、三养胃,冬天吃养人

苹果加它一起煮,效果很大,一润肺、二止咳、三养胃,冬天吃养人

Lily美食谈
2025-11-08 23:29:45
北美夺冠,耗资5.7亿,中国观众不买账,上映9小时票房仅255万

北美夺冠,耗资5.7亿,中国观众不买账,上映9小时票房仅255万

靠谱电影君
2025-11-07 09:20:26
固体杨枝甘露第一批受害者出现了,脸焦黄、肚子疼,医生:严重者甚至会影响生育!

固体杨枝甘露第一批受害者出现了,脸焦黄、肚子疼,医生:严重者甚至会影响生育!

观威海
2025-11-08 09:50:09
纪念“中国最后一位大学校长”刘道玉先生

纪念“中国最后一位大学校长”刘道玉先生

难得君
2025-11-08 08:57:11
美国称:中国不可怕,可怕的是,中国淘汰4000年的东西他们还在用

美国称:中国不可怕,可怕的是,中国淘汰4000年的东西他们还在用

文史微鉴
2025-11-05 11:23:04
女排全运最新积分!5支球队两连胜,7支球队未尝胜绩,第三轮前瞻

女排全运最新积分!5支球队两连胜,7支球队未尝胜绩,第三轮前瞻

排球黄金眼
2025-11-08 23:41:10
最“恨”吴石的她,却用一辈子守护了吴石的荣誉与尊严

最“恨”吴石的她,却用一辈子守护了吴石的荣誉与尊严

顾史
2025-11-08 14:12:44
卫士长回忆刘少奇去世时情景:没有哀乐,没有亲人,没有真实姓名

卫士长回忆刘少奇去世时情景:没有哀乐,没有亲人,没有真实姓名

帝哥说史
2025-11-08 06:35:03
陈芋汐炸鱼!407C出现重大失误,依然排名第一,领先第2名53.35分

陈芋汐炸鱼!407C出现重大失误,依然排名第一,领先第2名53.35分

体育就你秀
2025-11-09 07:49:47
全运会史上首次“不新建大型场馆”,为什么?

全运会史上首次“不新建大型场馆”,为什么?

环球网资讯
2025-11-08 22:01:06
世界上最安全的两个国家,一个谁也打不过,一个谁也不敢打。

世界上最安全的两个国家,一个谁也打不过,一个谁也不敢打。

百态人间
2025-10-29 15:27:08
快船队吞4连败!泰伦卢坑苦哈登:最后10分钟不换人+保罗首遭DNP

快船队吞4连败!泰伦卢坑苦哈登:最后10分钟不换人+保罗首遭DNP

锅子篮球
2025-11-09 18:40:30
俄媒:一旦开战,中方只靠解放军难以取胜,必须调动另一股力量!

俄媒:一旦开战,中方只靠解放军难以取胜,必须调动另一股力量!

军机Talk
2025-11-08 11:45:50
终身服药成历史?2025全球热门糖尿病医学范式革命:当前高血糖治疗可实现安全停药

终身服药成历史?2025全球热门糖尿病医学范式革命:当前高血糖治疗可实现安全停药

日照日报
2025-11-09 14:53:21
祖雄兵、曾琦因生活作风问题被停职调查!两人可能会有5种结局

祖雄兵、曾琦因生活作风问题被停职调查!两人可能会有5种结局

文史道
2025-11-09 16:41:23
59岁巩俐在北京公园,长了皱纹头发凌乱,喝老酸奶吃糖葫芦接地气

59岁巩俐在北京公园,长了皱纹头发凌乱,喝老酸奶吃糖葫芦接地气

心静物娱
2025-11-09 10:42:25
外媒:福建舰入列是“中国军事现代化最引人注目标志之一”

外媒:福建舰入列是“中国军事现代化最引人注目标志之一”

参考消息
2025-11-09 19:45:04
世界上平原面积最大的五个国家

世界上平原面积最大的五个国家

世界纵横说
2025-11-05 11:29:37
百万手提包,限量奢侈品仅裤子就9.5万,失宠贵妃派头究竟有多大

百万手提包,限量奢侈品仅裤子就9.5万,失宠贵妃派头究竟有多大

冒泡泡的鱼儿
2025-11-09 01:58:19
悄悄5连胜!联盟第1!东部大黑马诞生,康宁汉姆收获黄金搭档

悄悄5连胜!联盟第1!东部大黑马诞生,康宁汉姆收获黄金搭档

世界体育圈
2025-11-09 18:37:58
2025-11-09 20:27:00
果壳 incentive-icons
果壳
科技有意思
26784文章数 4149003关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

英伟达被华尔街大佬做空 4天市值蒸发4551亿美元

头条要闻

英伟达被华尔街大佬做空 4天市值蒸发4551亿美元

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

旅游
教育
手机
本地
房产

旅游要闻

成都银杏地图正式上线,解锁全城最美赏叶打卡地

教育要闻

来了来了上传啦!!传播学系统框架考前再复盘一遍(脑子丝滑滑!!!)

手机要闻

千元机价格旗舰级配置!vivo新机全配置曝光,是否值得期待?

本地新闻

这届干饭人,已经把博物馆吃成了食堂

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

无障碍浏览 进入关怀版