![]()
这份AI月报,是5月「黄钊的AI日报」中的干货认知点精华。
一、本月50个干货认知点
(一)关于AI组织
1、真正的价值:10倍效率改变的,不是工作速度,而是试错成本。
2、AI-First不是用AI提效,而是让AI驱动公司运转。
3、构建AI原生公司的第一步:让公司对 AI 可读。
4、Anthropic的领先不在技术,而在组织流程。
5、前沿模型公司里,CFO已接近Infra负责人,30~40%时间花在算力上——Claude的产品能力,最后落脚于“算力采购和分配表”。(最难的是提前量:芯片、机房、电力、云合同都要提前规划;不可能下周想要一吉瓦,下周就拿到)
6、讨论前先各自跟AI聊——“纯人工头脑风暴”已被禁止。
7、组织文化护城河的本质:创造力、技术以及将二者巧妙融合的能力……(皮克斯)花了10年时间。
(二)关于Agent
1、最大的风险:别人的Agent很强,但你感知不到。
2、团队Skills共享——Agent产品下一个战场在团队协同。
3、“缓存命中率”会从后台指标,变成产品能力。
4、Agent Team的核心:不是"多",而是角色间有没有制衡。
5、不要做多Agent编排;人类的分工逻辑,不适用于AI(AI无需“一个人想、一个人写、一个人审”)
6、多Agent群聊”不成立(一个Agent开很多子代理,就够用),“多人+1个Agent的群聊”还ok。
7、不要搞RAG,直接上Agent,外加适合AI阅读的文档站。
(三)关于vibe coding
1、不要做 demo,要照着生产级去做……你才知道这一代工具的真正边界在哪儿。
2、真正的力量,不是写 PRD,而是当着客户的面,把客户的核心业务“现场自动化 50~70%”。
3、每家公司的财务部、HR 部、营销部、销售部,都会出现一群“非程序员背景的 coder”。
4、用户写反馈,5分钟后APP就可改完了;甚至,用户反馈也不需要了,AI直接自主优化。
5、文章别再“收藏”,而要“fork”——收藏是消费,Fork是运维。Fork:这段东西有价值,要在我自己的环境里,让它跑起来。
6、真正的 vibe coding,不是"AI帮你写代码",而是"忘记代码的存在"。
7、重点不是“把已有东西做得更快”,而是做出“以前根本不可能存在”的东西。
8、最好的创造,是那种具有破坏性的;真正的 build ,其实是在 destroy。
9、最适合vibe coding尝试的场景,是那些你本身不是专家(不够90分)、但正好又是“高级玩家”的熟悉爱好领域(有80分的领域taste能力)。
10、把文章给CC或Codex,说"按这套方法,帮我写一个小工具"。
(四)AI深度认知
1、未来世界,很可能不是“人使用 AI”,而是:人生活在人类网络里、AI生活在智能体网络里,然后通过双原生架构,彼此接壤。
2、双原生架构:同时属于两个世界——系统内部运行AI原生逻辑、系统外部保持人类原生体验。
3、不停强化Harness,只会离AI Native越来越远——它把人类的注意力,错误地引导向了“AI”这一端。
3、唯一真实的Benchmark,就是你自己的工作流。如果在最烂熟于心的工作上,你都感觉不出差异,那这些跑分对你来说,没有任何意义。
4、AI的边界与价值,就在于内心意象的“复杂度”和“精确度”——画面感和文字功底。
5、AI- native产品的check标准之一:是否有“持续维护”的价值和必要性?如果有,反而就是壁垒——“一步领先、步步领先”(如果别人抄袭你,还是永远赶不上你)
6、要么拥有整个工作流,要么就是在给别人做功能。
7、AI世界的核心,会从Prompt Engineering 转向Protocol Engineering;也意味着,当前各种热词,都没啥意义了。
8、voice AI 是"新的上下文层",而非"一个能接电话的功能"。
9、AI是一门需要练习的语言,不是买来就变强的装备。
10、不要把宝押在“我能比所有人,更早预测未来”,把宝押在“我能比所有人,更早承认事实已变”。
11、“AI直出(文章)”生产成本很低,但不代表没有阅读成本。
12、Anthropic整个产品逻辑,就是赌"模型能力会涨到一个点",提前把“那个点对应的产品”做出来。
(五)具身智能
1、具身智能首要解决的,就是“知识压缩”问题;大部分公司,在重复当年NLP的弯路,都聚焦在“知识提取”这一步,跳过了预训练,直接做对齐。
2、具身智能的瓶颈,是训练数据的物理真假(物理一致性,是数据质量的底线)
3、制造业的真实痛点:不是缺机器人,是缺柔性。
4、宇树发布载人变形机甲GD01,载人后总重约500kg,售价390万元起。
(六)行业相关
1、Anthropic有机会超过Open AI,是个历史性时刻——利他主义的一方,正在战胜加速主义的一方。(Greg曾提出,可把AGI卖给核大国,Dario 听完几乎当场辞职)
2、AI替代的不是建造者和销售者,而是"度量者"——Cloudflare裁掉前名员工、再招千名实习生;这个做法,很可能变成整个行业常态。
3、Coding不是编程能力,是AGI的环境——AGI两年内实现。
4、路线图:Chatbot是第一幕,Coding Agent是第二幕,自动化AI研究员是第三幕。
5、派遣一个Agent执行任务,它能从失败中自我修复,并坚持直到完成工作——这就是AGI。
6、深科技创业通常需要 10 年,那AGI 会在旅程中途出现,你的商业计划,必须把这个因素算进去。
7、Mythos捅破人类评测框架的天花板,逼近2027年 AGI 奇点。
8、Claude 金融 AI 布局:Agent 已颠覆编程,金融是下一个 。
9、若一个工具,能让10岁孩子做出应用,我看不到它会是泡沫。
10、和 Lex Fridman 在北京喝啤酒。
二、本月5个“黄钊hanniman评注”
1、不停强化Harness,只会离AI Native越来越远
这个词,不仅没抓住「人与AI协同」的核心,反而将认知,引向了南辕北辙的“死胡同”。“Harness”的本意是马具,暗示了居高临下的、机械性的绝对控制。
此语境下,人是拿着缰绳的车夫,AI是需要被驯服的马。这种思维,导致了巨大的误区:它把人类的注意力,错误地引导向了“AI”这一端。人们死磕提示词工程、上下文工程,试图“锁死AI的每一次输出”。一旦结果偏离预期,人会认为是自己“控制不力”,进而增加更多强硬指令。然而LLM本身,能力已极其强大。
若你试图去“驾驭”AI,实际上是在做“有点用,但不会一直有用”的过度控制。
人类正确的视角,应是去描述世界,而不是描述怎么控制AI。
黄钊hanniman评注:这个认知太对了,只不过,当前还是行业的非共识。
类似的,我3月初在星球里,发过【重要】文章《过度钻研Prompt,可能是弄反了方向》
面向终局,真正关键的技能点,是“画面感+文字功底”。
或者说,即使要做harness,也是AI公司的事,不是我们个体应该做的事(如果做,长期看,一定会被吞噬掉)。——我们应该面向“harness已成熟”这个终局假设,来创造价值。
2、市场坐标系,不应再沿用To B/To C,而应以To Human/To Agent划分
To B/To C边界正在模糊:AI工具的普及顺序,普遍为个人先付费、公司IT预算随后追入;同一款产品,同时服务“个人工作流”与“组织工作流”。
整个市场,都在为Agent打造生产环境,且Agent已开始以独立身份,发起交易、消耗资源、产出价值,从产品设计,到投资价值判断,都需建立一套agent-native标尺。
黄钊hanniman评注:在2023年9月文章《》中的第10点,我就明确提出,“未来AI企业,方向定位将不是按照To C/To B来划分,而是按照To 人/To AI 来划分。”(原文中有详细分析说明)
但更关键的问题在于,为什么我能提前这么多年,在相关事物都还没出现时,就“直接”冒出这个认知?不是通过逻辑推导,而是直接从“心”去感受某个东西。详见《》
![]()
3、核心判断:具身智能的瓶颈,是训练数据的物理真假
数据必须在物理上「成立」,scale才有意义;否则,是在以更大规模,放大系统性错误。
今天主流的仿真器,可在简单刚体场景工作,但一进入复杂场景(刚柔混合、密集接触),就迅速失效;因为,训练数据的物理规律,本身有偏差,模型学到的只是“真实世界的近似直觉”,在特定环境成立,却缺乏泛化能力。
复杂场景里决定成败的,是仿真里的物理规律(力、摩擦、形变)是否算对,而这恰恰长期被简化、被近似处理;Physical AI的物理一致性,是数据质量的底线,这条线没守住,上面做再多数据配比、算法创新,根基都不稳。
模型能力的上限,往往不由模型决定,而由数据的结构与真实性决定。
黄钊hanniman评注:这是一个巨大的认知(选择)分叉口(物理一致性,是数据质量的底线),关注具身智能/机器人领域的同学,需要留意本篇文章。
24年6月,在星球里,我分享过一篇【重要】文章《大模型最核心的,可能不是架构或参数,而是完全由数据集决定》,很多新团员还没看过,强烈推荐,会打开你的认知角度。
4、如果我不亲自下场,我就跟不上这一波「软件工程」的革ming。
搞完这一波,我的体会是:这三个月,相当于压缩了一个软件工程硕士的训练量,甚至压缩了普通程序员三3、5年的实战经验。
不是我有多强,是 AI 太强。我只是把它用到了PM们很少用到的深度。而这个深度,你不亲自跳进去是看不见的。
听别人讲、看 demo 只能体会到朦胧的“挺厉害“。但你真的去做一个有付费用户、上线必须不能崩、改错bug 第二天就有人投诉的产品,你才知道这一代工具的真正边界在哪儿。
黄钊hanniman评注:不是“AI 产品经理“这件小事,而是软件工程本身正在被重写——原文中这句话,非常重要,要站在这个高度,意识到整个事情的“意义”。
5、AI-First不是用AI提效,而是让AI驱动公司运转。
之前每个工程师用AI写代码、产品经理用AI写PRD、设计师用AI做图,效率并未提升,反而因为节奏不同,对齐成本变得非常高。
AI-First下,对齐由AI主导——比如AI告诉市场团队“今天工程师要发布哪些功能”,市场团队不用再反复问工程师。
黄钊hanniman评注:不仅是工作场景,2C场景,未来也会这样(Agent在人之间沟通斡旋)。
以上内容,引自「黄钊的AI日报」第十季(已完结)。
【One More Thing】
「黄钊的AI日报·第十一季」早鸟票(60元优惠福利),将于本周五(5号)20点正式开启,“抢跑群”现已开始招募~
感兴趣的同学,可以加助理乐乐微信,发送“抢跑”二字。
1、持续90天、每天5条AI内容点:不是常见的新闻汇总,而是站在13年AI产品经理视角,提炼干货认知、展示“what I see”。
2、在我们社群“AI产品经理大本营”内,AI日报已运营了35个月,很多同学把其当成自己的“第一AI信息源”,真的可以节省很多时间(每天至少1小时)。只要连续看2、3个月,会明显比身边朋友同事,有更多认知差和信息差。
3、用户好评如潮,。
适合人群:对“AI内容质量”要求非常高的CEO/CXO/VP、产品总监/产品经理、技术/投资/媒体人、AI/互联网同行、老师/学生。
黄钊hanniman,前腾讯PM,前图灵机器人-人才战略官/AI产品经理,13年AI、16年互联网经验;社群“”(9年)和自媒体“hanniman”(12年);作品有《》、「黄钊的AI日报」。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.