网易首页 > 网易号 > 正文 申请入驻

o1已不是聊天模型了!SpaceX前工程师公开全新使用秘籍

0
分享至

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

苹果&SpaceX前工程师分享o1使用心得,奥特曼、Brockman都转发了。

划重点:

o1已经不是聊天模型了,需要全新的使用方法。

奥特曼还跑去挖坟作者Ben Hylak数天前的“自我打脸”评论,称“观察o1的口碑变化、以及人们学习如何使用它很有趣”。

Ben Hylak曾任SpaceX软件工程师、苹果VisionOS人机交互设计师,目前在创业为AI产品提供分析服务。

具体来说,Ben在o1 pro推出满血$200/月版本的第一天就交钱了,整整测试了一天后得出结论:它真的很糟糕!

  • 每次提问都要等待5分钟
  • 会输出自相矛盾的建议
  • 没有要求但总是会回复架构图+优势/劣势列表

Ben把糟糕的体验发在网上后,很多人表示同感。但有趣的是,也有人强烈反对。

他开始与持不同观点的讨论,然后意识到原来是自己的方法完全错了。

我还在把o1当聊天模型来用,但o1已经不是聊天模型了。

现在,Ben已经从讨厌o1,转变成了每天都在用它解决最重要的问题。

像对待新员工一样对待o1

如果说o1不是聊天模型了,那它现在是什么?

Ben认为它就像一个“报告生成器”。如果你给它足够的上下文,并告诉它你想要输出什么,它通常会一次性找到解决方案。

OpenAI官方其实给了一个简单的o1使用建议,但并不完善。

Ben的建议包括:

提供海量背景信息

不管你现在是怎么理解“海量”的,再乘以10倍。

当使用GPT-4o或Claude 3.5等聊天模型时,通常会从一个简单的问题和一些背景信息开始。如果模型需要更多背景信息,它通常会要求你继续提供。

这就是聊天模型的本质,从一来一回的交互中不断完善输出。

但o1只会从表面上回答你提出的问题,不会试图从你那里获取背景信息。所以需要反过来将尽可能多的上下文主动发给它。

即使只是问一个简单的代码工程问题,应该提供:

  • 解释所有你尝试过但不起作用的方案
  • 一份完整的数据库schemas
  • 解释一下你的公司是做什么的,规模多大,定义内部术语

总而言之,就像对待新员工一样对待o1。

描述你想要什么,而不是指导它如何做

对于大多数聊天模型,我们都会告诉模型希望他如何回复模式,比如“扮演一位软件工程专家,请仔细思考”。

但在o1上有效的方法正相反,告诉它你需要什么,而不是指导它如何去做。

Ben把o1的提示词模板分成4部分:

  • 目标放在最前面
  • 详细指定输出格式
  • 可以附加需要检查的注意事项
  • 海量相关的背景信息

最后,o1的输出有一种学术/商业报告的风格。Ben认为太多的推理token让它很难摆脱这种风格

他曾试图让o1来完成这篇文章,但经过多次尝试,只能得到非常平淡的学生作业。

One More Thing

在奥特曼的转发推文中,有人套出了最新消息:

o3暂时还不会向用户开放,o3-mini会先推出,而且时间不远了。

o3-mini会先提供给Plus订阅用户使用,API的定价OpenAI内部还没确定,但不会很贵。

参考链接:
[1]https://www.latent.space/p/o1-skill-issue
[2]https://x.com/sama/status/1877814065088663763
[3]https://x.com/gdb/status/1878489681702310392

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大爆冷!湖人117-135黄蜂,本场谁是罪魁祸首,数据不会说谎!

大爆冷!湖人117-135黄蜂,本场谁是罪魁祸首,数据不会说谎!

刘哥谈体育
2026-01-16 14:32:46
贾国龙开撕罗永浩的真相

贾国龙开撕罗永浩的真相

首席品牌评论
2026-01-16 23:47:37
帮手全到齐,伊朗导弹库存暴增,中方及时声援,美英连夜通告撤军

帮手全到齐,伊朗导弹库存暴增,中方及时声援,美英连夜通告撤军

回京历史梦
2026-01-15 18:33:08
农村香烟突然卖不动了,这4个原因普遍存在,看看有没有你?

农村香烟突然卖不动了,这4个原因普遍存在,看看有没有你?

文雅笔墨
2026-01-16 12:41:40
罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

瓜汁橘长Dr
2025-12-29 11:29:56
活到60岁我才懂:如果女人没有给过你这三样东西,说明她并不爱你

活到60岁我才懂:如果女人没有给过你这三样东西,说明她并不爱你

林林故事揭秘
2025-09-03 14:08:02
”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

张晓磊
2025-11-07 11:34:05
“两岸统一”突破点不在马英九,也不在国民党,可能在这个人身上

“两岸统一”突破点不在马英九,也不在国民党,可能在这个人身上

趣文说娱
2026-01-12 17:36:51
油烟直排造成大气污染 北京烤肉刘被罚7000元

油烟直排造成大气污染 北京烤肉刘被罚7000元

信网
2026-01-16 07:16:44
湖北某光伏公司快倒闭了!

湖北某光伏公司快倒闭了!

黯泉
2026-01-16 22:16:46
美媒叹息:中国几百万“剽窃”美国熔盐堆技术,如今技术反超10年

美媒叹息:中国几百万“剽窃”美国熔盐堆技术,如今技术反超10年

牛牛叨史
2026-01-15 02:48:46
北京多场“京味”活动鼓励市民到京郊过年

北京多场“京味”活动鼓励市民到京郊过年

新京报
2026-01-15 18:28:05
重庆一死者被定为三人恶势力成员引争议,曾被检方认定为微罪不诉,发回重审后成黑社会骨干

重庆一死者被定为三人恶势力成员引争议,曾被检方认定为微罪不诉,发回重审后成黑社会骨干

大风新闻
2026-01-16 17:00:04
优质“蛋白质”排行榜!大豆排倒数第1,虾肉才排第4,第一名很多人都不知道

优质“蛋白质”排行榜!大豆排倒数第1,虾肉才排第4,第一名很多人都不知道

美食格物
2025-12-29 16:58:15
上海崇明区政协原党组副书记张荣,被开除党籍!沉迷赌博,大搞权钱交易

上海崇明区政协原党组副书记张荣,被开除党籍!沉迷赌博,大搞权钱交易

上观新闻
2026-01-15 18:24:11
A股:刚刚,中央一部门发声,释放一信号,下周两个关键位定生死

A股:刚刚,中央一部门发声,释放一信号,下周两个关键位定生死

云鹏叙事
2026-01-17 00:00:06
有男生愿意吗?湖南一独生女招上门女婿,给10万彩礼孩子跟女方姓

有男生愿意吗?湖南一独生女招上门女婿,给10万彩礼孩子跟女方姓

唐小糖说情感
2026-01-15 19:32:55
河南省离退休人员超600万,人均养老金能有3000元吗?一起算一下

河南省离退休人员超600万,人均养老金能有3000元吗?一起算一下

暖心人社
2026-01-16 20:41:43
向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

心静物娱
2025-12-24 11:02:28
台媒指大S离世一年,汪小菲与徐家重开协商,抚养费之争出现转机

台媒指大S离世一年,汪小菲与徐家重开协商,抚养费之争出现转机

手工制作阿歼
2026-01-17 04:56:32
2026-01-17 06:00:49
量子位 incentive-icons
量子位
追踪人工智能动态
12023文章数 176360关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

游戏
时尚
亲子
旅游
军事航空

十三年后,《逆战:未来》想为所有逆行者们找回青春"/> 主站 商城 论坛 自运营 登录 注册 十三年后,《逆战:未来》想为所有逆行者们找回青春 廉颇 2...

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

亲子要闻

精神科医生:家长的“为你好”也可能对孩子造成创伤

旅游要闻

北境飘雪南园绽,青秀山用一场菊花展,藏住南宁冬日顶流密码!

军事要闻

欧洲多国向格陵兰岛派遣军事人员 白宫回应

无障碍浏览 进入关怀版