网易首页 > 网易号 > 正文 申请入驻

o1已不是聊天模型了!SpaceX前工程师公开全新使用秘籍

0
分享至

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

苹果&SpaceX前工程师分享o1使用心得,奥特曼、Brockman都转发了。

划重点:

o1已经不是聊天模型了,需要全新的使用方法。

奥特曼还跑去挖坟作者Ben Hylak数天前的“自我打脸”评论,称“观察o1的口碑变化、以及人们学习如何使用它很有趣”。

Ben Hylak曾任SpaceX软件工程师、苹果VisionOS人机交互设计师,目前在创业为AI产品提供分析服务。

具体来说,Ben在o1 pro推出满血$200/月版本的第一天就交钱了,整整测试了一天后得出结论:它真的很糟糕!

  • 每次提问都要等待5分钟
  • 会输出自相矛盾的建议
  • 没有要求但总是会回复架构图+优势/劣势列表

Ben把糟糕的体验发在网上后,很多人表示同感。但有趣的是,也有人强烈反对。

他开始与持不同观点的讨论,然后意识到原来是自己的方法完全错了。

我还在把o1当聊天模型来用,但o1已经不是聊天模型了。

现在,Ben已经从讨厌o1,转变成了每天都在用它解决最重要的问题。

像对待新员工一样对待o1

如果说o1不是聊天模型了,那它现在是什么?

Ben认为它就像一个“报告生成器”。如果你给它足够的上下文,并告诉它你想要输出什么,它通常会一次性找到解决方案。

OpenAI官方其实给了一个简单的o1使用建议,但并不完善。

Ben的建议包括:

提供海量背景信息

不管你现在是怎么理解“海量”的,再乘以10倍。

当使用GPT-4o或Claude 3.5等聊天模型时,通常会从一个简单的问题和一些背景信息开始。如果模型需要更多背景信息,它通常会要求你继续提供。

这就是聊天模型的本质,从一来一回的交互中不断完善输出。

但o1只会从表面上回答你提出的问题,不会试图从你那里获取背景信息。所以需要反过来将尽可能多的上下文主动发给它。

即使只是问一个简单的代码工程问题,应该提供:

  • 解释所有你尝试过但不起作用的方案
  • 一份完整的数据库schemas
  • 解释一下你的公司是做什么的,规模多大,定义内部术语

总而言之,就像对待新员工一样对待o1。

描述你想要什么,而不是指导它如何做

对于大多数聊天模型,我们都会告诉模型希望他如何回复模式,比如“扮演一位软件工程专家,请仔细思考”。

但在o1上有效的方法正相反,告诉它你需要什么,而不是指导它如何去做。

Ben把o1的提示词模板分成4部分:

  • 目标放在最前面
  • 详细指定输出格式
  • 可以附加需要检查的注意事项
  • 海量相关的背景信息

最后,o1的输出有一种学术/商业报告的风格。Ben认为太多的推理token让它很难摆脱这种风格

他曾试图让o1来完成这篇文章,但经过多次尝试,只能得到非常平淡的学生作业。

One More Thing

在奥特曼的转发推文中,有人套出了最新消息:

o3暂时还不会向用户开放,o3-mini会先推出,而且时间不远了。

o3-mini会先提供给Plus订阅用户使用,API的定价OpenAI内部还没确定,但不会很贵。

参考链接:
[1]https://www.latent.space/p/o1-skill-issue
[2]https://x.com/sama/status/1877814065088663763
[3]https://x.com/gdb/status/1878489681702310392

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伤亡比例1比5!多布罗皮利亚被围俄军弹尽粮绝,大批士兵主动投降

伤亡比例1比5!多布罗皮利亚被围俄军弹尽粮绝,大批士兵主动投降

知兵
2025-09-14 22:02:52
被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

被央视怒批、摇头晃脑、德不配位,难怪阅兵从不邀请“流量”明星

书雁飞史oh
2025-09-12 16:09:35
媒体人:吴艳妮“亚洲第一”彻底沦为营销,她被日本选手全面压制

媒体人:吴艳妮“亚洲第一”彻底沦为营销,她被日本选手全面压制

直播吧
2025-09-14 17:03:06
省长讲第一课,广东全省市委书记、市长、县委书记、县长集中培训

省长讲第一课,广东全省市委书记、市长、县委书记、县长集中培训

新京报政事儿
2025-09-14 13:32:41
俄将在华发行债券?100多年前的沙俄,曾经在东北发行过纸质卢布

俄将在华发行债券?100多年前的沙俄,曾经在东北发行过纸质卢布

小莜读史
2025-09-14 14:44:36
西贝硬刚罗永浩,卫健委出手了!

西贝硬刚罗永浩,卫健委出手了!

梳子姐
2025-09-13 19:16:39
张文宏呼吁:60岁后千万别做这几项健康检查,做了可能会害你

张文宏呼吁:60岁后千万别做这几项健康检查,做了可能会害你

霹雳炮
2025-09-11 23:13:49
上海下周初还是热,周四开始要降温了

上海下周初还是热,周四开始要降温了

澎湃新闻
2025-09-14 18:22:27
欧盟与俄罗斯都在加急,争抢购买中国同一关键物品,究竟是什么让他们如此着急?

欧盟与俄罗斯都在加急,争抢购买中国同一关键物品,究竟是什么让他们如此着急?

文雅笔墨
2025-09-14 19:31:37
罗永浩向贾国龙重新开战后,深夜发文称希望与其当面直播对话

罗永浩向贾国龙重新开战后,深夜发文称希望与其当面直播对话

极目新闻
2025-09-15 02:05:07
国家点名!这10个地区,被委以重任

国家点名!这10个地区,被委以重任

国民经略
2025-09-12 11:42:38
王毅表态:战争解决不了问题、制裁只会使问题更复杂

王毅表态:战争解决不了问题、制裁只会使问题更复杂

政知新媒体
2025-09-14 12:58:15
山东一中学学生在食堂站着用餐遭质疑,校方回应:一直没座位,都是站着吃

山东一中学学生在食堂站着用餐遭质疑,校方回应:一直没座位,都是站着吃

新晚报
2025-09-13 16:35:47
不明飞行物被击落后续:海事局发通报显端倪,身份快真相大白了!

不明飞行物被击落后续:海事局发通报显端倪,身份快真相大白了!

科普100克克
2025-09-15 02:28:33
全数崩跌,5000万订单成为世界笑柄,订单营销玩不下去了!

全数崩跌,5000万订单成为世界笑柄,订单营销玩不下去了!

柏铭锐谈
2025-09-14 13:12:13
1小时爆卖230亿!李书福杭州湾库里南,一夜间血洗BBA

1小时爆卖230亿!李书福杭州湾库里南,一夜间血洗BBA

象视汽车
2025-09-14 07:00:13
重磅消息!七国集团财政部长考虑对俄罗斯支持者征收关税!

重磅消息!七国集团财政部长考虑对俄罗斯支持者征收关税!

翻开历史和现实
2025-09-14 16:10:21
妈妈亲手缝的NIKE书包火了!品牌留言要送礼物,当事人:已经联系礼物还未寄到

妈妈亲手缝的NIKE书包火了!品牌留言要送礼物,当事人:已经联系礼物还未寄到

现代快报
2025-09-14 15:13:20
长安首款固态电池来袭:充电10分钟续航1500km!网友:新能源天花板

长安首款固态电池来袭:充电10分钟续航1500km!网友:新能源天花板

刘旷
2025-09-14 15:21:12
9月开学后,整个教育方向都要变了。

9月开学后,整个教育方向都要变了。

玉辞心
2025-09-12 07:19:15
2025-09-15 08:04:49
量子位 incentive-icons
量子位
追踪人工智能动态
11313文章数 176268关注度
往期回顾 全部

科技要闻

AI眼镜能否成为下一代人机互动的超级入口?

头条要闻

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

头条要闻

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

艺术
亲子
健康
数码
公开课

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

亲子要闻

张檬家宝贝Dylan首亮相小区,5个月被吓哭,胆小模样引全网心疼

内分泌科专家破解身高八大谣言

数码要闻

传苹果智能眼镜将于2026年底至2027年初上市 暂不支持AR功能

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版