黄钊的AI月报（26年5月）_50个干货认知点+5个“黄钊hanniman评注”|算法|工作流|上下文|新论文|agent

分享至

这份AI月报，是5月「黄钊的AI日报」中的干货认知点精华。

一、本月50个干货认知点

（一）关于AI组织

1、真正的价值：10倍效率改变的，不是工作速度，而是试错成本。

2、AI-First不是用AI提效，而是让AI驱动公司运转。

3、构建AI原生公司的第一步：让公司对 AI 可读。

4、Anthropic的领先不在技术，而在组织流程。

5、前沿模型公司里，CFO已接近Infra负责人，30～40%时间花在算力上——Claude的产品能力，最后落脚于“算力采购和分配表”。（最难的是提前量：芯片、机房、电力、云合同都要提前规划；不可能下周想要一吉瓦，下周就拿到）

6、讨论前先各自跟AI聊——“纯人工头脑风暴”已被禁止。

7、组织文化护城河的本质：创造力、技术以及将二者巧妙融合的能力……（皮克斯）花了10年时间。

（二）关于Agent

1、最大的风险：别人的Agent很强，但你感知不到。

2、团队Skills共享——Agent产品下一个战场在团队协同。

3、“缓存命中率”会从后台指标，变成产品能力。

4、Agent Team的核心：不是"多"，而是角色间有没有制衡。

5、不要做多Agent编排；人类的分工逻辑，不适用于AI（AI无需“一个人想、一个人写、一个人审”）

6、多Agent群聊”不成立（一个Agent开很多子代理，就够用），“多人+1个Agent的群聊”还ok。

7、不要搞RAG，直接上Agent，外加适合AI阅读的文档站。

（三）关于vibe coding

1、不要做 demo，要照着生产级去做……你才知道这一代工具的真正边界在哪儿。

2、真正的力量，不是写 PRD，而是当着客户的面，把客户的核心业务“现场自动化 50~70%”。

3、每家公司的财务部、HR 部、营销部、销售部，都会出现一群“非程序员背景的 coder”。

4、用户写反馈，5分钟后APP就可改完了；甚至，用户反馈也不需要了，AI直接自主优化。

5、文章别再“收藏”，而要“fork”——收藏是消费，Fork是运维。Fork：这段东西有价值，要在我自己的环境里，让它跑起来。

6、真正的 vibe coding，不是"AI帮你写代码"，而是"忘记代码的存在"。

7、重点不是“把已有东西做得更快”，而是做出“以前根本不可能存在”的东西。

8、最好的创造，是那种具有破坏性的；真正的 build ，其实是在 destroy。

9、最适合vibe coding尝试的场景，是那些你本身不是专家（不够90分）、但正好又是“高级玩家”的熟悉爱好领域（有80分的领域taste能力）。

10、把文章给CC或Codex，说"按这套方法，帮我写一个小工具"。

（四）AI深度认知

1、未来世界，很可能不是“人使用 AI”，而是：人生活在人类网络里、AI生活在智能体网络里，然后通过双原生架构，彼此接壤。

2、双原生架构：同时属于两个世界——系统内部运行AI原生逻辑、系统外部保持人类原生体验。

3、不停强化Harness，只会离AI Native越来越远——它把人类的注意力，错误地引导向了“AI”这一端。

3、唯一真实的Benchmark，就是你自己的工作流。如果在最烂熟于心的工作上，你都感觉不出差异，那这些跑分对你来说，没有任何意义。

4、AI的边界与价值，就在于内心意象的“复杂度”和“精确度”——画面感和文字功底。

5、AI- native产品的check标准之一：是否有“持续维护”的价值和必要性？如果有，反而就是壁垒——“一步领先、步步领先”（如果别人抄袭你，还是永远赶不上你）

6、要么拥有整个工作流，要么就是在给别人做功能。

7、AI世界的核心，会从Prompt Engineering 转向Protocol Engineering；也意味着，当前各种热词，都没啥意义了。

8、voice AI 是"新的上下文层"，而非"一个能接电话的功能"。

9、AI是一门需要练习的语言，不是买来就变强的装备。

10、不要把宝押在“我能比所有人，更早预测未来”，把宝押在“我能比所有人，更早承认事实已变”。

11、“AI直出（文章）”生产成本很低，但不代表没有阅读成本。

12、Anthropic整个产品逻辑，就是赌"模型能力会涨到一个点"，提前把“那个点对应的产品”做出来。

（五）具身智能

1、具身智能首要解决的，就是“知识压缩”问题；大部分公司，在重复当年NLP的弯路，都聚焦在“知识提取”这一步，跳过了预训练，直接做对齐。

2、具身智能的瓶颈，是训练数据的物理真假（物理一致性，是数据质量的底线）

3、制造业的真实痛点：不是缺机器人，是缺柔性。

4、宇树发布载人变形机甲GD01，载人后总重约500kg，售价390万元起。

（六）行业相关

1、Anthropic有机会超过Open AI，是个历史性时刻——利他主义的一方，正在战胜加速主义的一方。（Greg曾提出，可把AGI卖给核大国，Dario 听完几乎当场辞职）

2、AI替代的不是建造者和销售者，而是"度量者"——Cloudflare裁掉前名员工、再招千名实习生；这个做法，很可能变成整个行业常态。

3、Coding不是编程能力，是AGI的环境——AGI两年内实现。

4、路线图：Chatbot是第一幕，Coding Agent是第二幕，自动化AI研究员是第三幕。

5、派遣一个Agent执行任务，它能从失败中自我修复，并坚持直到完成工作——这就是AGI。

6、深科技创业通常需要 10 年，那AGI 会在旅程中途出现，你的商业计划，必须把这个因素算进去。

7、Mythos捅破人类评测框架的天花板，逼近2027年 AGI 奇点。

8、Claude 金融 AI 布局：Agent 已颠覆编程，金融是下一个。

9、若一个工具，能让10岁孩子做出应用，我看不到它会是泡沫。

10、和 Lex Fridman 在北京喝啤酒。

二、本月5个“黄钊hanniman评注”

1、不停强化Harness，只会离AI Native越来越远

这个词，不仅没抓住「人与AI协同」的核心，反而将认知，引向了南辕北辙的“死胡同”。“Harness”的本意是马具，暗示了居高临下的、机械性的绝对控制。
此语境下，人是拿着缰绳的车夫，AI是需要被驯服的马。这种思维，导致了巨大的误区：它把人类的注意力，错误地引导向了“AI”这一端。人们死磕提示词工程、上下文工程，试图“锁死AI的每一次输出”。一旦结果偏离预期，人会认为是自己“控制不力”，进而增加更多强硬指令。然而LLM本身，能力已极其强大。
若你试图去“驾驭”AI，实际上是在做“有点用，但不会一直有用”的过度控制。
人类正确的视角，应是去描述世界，而不是描述怎么控制AI。

黄钊hanniman评注：这个认知太对了，只不过，当前还是行业的非共识。

类似的，我3月初在星球里，发过【重要】文章《过度钻研Prompt，可能是弄反了方向》

面向终局，真正关键的技能点，是“画面感+文字功底”。

或者说，即使要做harness，也是AI公司的事，不是我们个体应该做的事（如果做，长期看，一定会被吞噬掉）。——我们应该面向“harness已成熟”这个终局假设，来创造价值。

2、市场坐标系，不应再沿用To B/To C，而应以To Human/To Agent划分

To B/To C边界正在模糊：AI工具的普及顺序，普遍为个人先付费、公司IT预算随后追入；同一款产品，同时服务“个人工作流”与“组织工作流”。

整个市场，都在为Agent打造生产环境，且Agent已开始以独立身份，发起交易、消耗资源、产出价值，从产品设计，到投资价值判断，都需建立一套agent-native标尺。

黄钊hanniman评注：在2023年9月文章《》中的第10点，我就明确提出，“未来AI企业，方向定位将不是按照To C/To B来划分，而是按照To 人/To AI 来划分。”（原文中有详细分析说明）

但更关键的问题在于，为什么我能提前这么多年，在相关事物都还没出现时，就“直接”冒出这个认知？不是通过逻辑推导，而是直接从“心”去感受某个东西。详见《》

3、核心判断：具身智能的瓶颈，是训练数据的物理真假

数据必须在物理上「成立」，scale才有意义；否则，是在以更大规模，放大系统性错误。

今天主流的仿真器，可在简单刚体场景工作，但一进入复杂场景（刚柔混合、密集接触），就迅速失效；因为，训练数据的物理规律，本身有偏差，模型学到的只是“真实世界的近似直觉”，在特定环境成立，却缺乏泛化能力。

复杂场景里决定成败的，是仿真里的物理规律（力、摩擦、形变）是否算对，而这恰恰长期被简化、被近似处理；Physical AI的物理一致性，是数据质量的底线，这条线没守住，上面做再多数据配比、算法创新，根基都不稳。

模型能力的上限，往往不由模型决定，而由数据的结构与真实性决定。

黄钊hanniman评注：这是一个巨大的认知（选择）分叉口（物理一致性，是数据质量的底线），关注具身智能/机器人领域的同学，需要留意本篇文章。

24年6月，在星球里，我分享过一篇【重要】文章《大模型最核心的，可能不是架构或参数，而是完全由数据集决定》，很多新团员还没看过，强烈推荐，会打开你的认知角度。

4、如果我不亲自下场，我就跟不上这一波「软件工程」的革ming。

搞完这一波，我的体会是：这三个月，相当于压缩了一个软件工程硕士的训练量，甚至压缩了普通程序员三3、5年的实战经验。

不是我有多强，是 AI 太强。我只是把它用到了PM们很少用到的深度。而这个深度，你不亲自跳进去是看不见的。

听别人讲、看 demo 只能体会到朦胧的“挺厉害“。但你真的去做一个有付费用户、上线必须不能崩、改错bug 第二天就有人投诉的产品，你才知道这一代工具的真正边界在哪儿。

黄钊hanniman评注：不是“AI 产品经理“这件小事，而是软件工程本身正在被重写——原文中这句话，非常重要，要站在这个高度，意识到整个事情的“意义”。

5、AI-First不是用AI提效，而是让AI驱动公司运转。

之前每个工程师用AI写代码、产品经理用AI写PRD、设计师用AI做图，效率并未提升，反而因为节奏不同，对齐成本变得非常高。

AI-First下，对齐由AI主导——比如AI告诉市场团队“今天工程师要发布哪些功能”，市场团队不用再反复问工程师。

黄钊hanniman评注：不仅是工作场景，2C场景，未来也会这样（Agent在人之间沟通斡旋）。

以上内容，引自「黄钊的AI日报」第十季（已完结）。

【One More Thing】

「黄钊的AI日报·第十一季」早鸟票（60元优惠福利），将于本周五（5号）20点正式开启，“抢跑群”现已开始招募~

感兴趣的同学，可以加助理乐乐微信，发送“抢跑”二字。

1、持续90天、每天5条AI内容点：不是常见的新闻汇总，而是站在13年AI产品经理视角，提炼干货认知、展示“what I see”。

2、在我们社群“AI产品经理大本营”内，AI日报已运营了35个月，很多同学把其当成自己的“第一AI信息源”，真的可以节省很多时间（每天至少1小时）。只要连续看2、3个月，会明显比身边朋友同事，有更多认知差和信息差。

3、用户好评如潮，。

适合人群：对“AI内容质量”要求非常高的CEO/CXO/VP、产品总监/产品经理、技术/投资/媒体人、AI/互联网同行、老师/学生。

黄钊hanniman，前腾讯PM，前图灵机器人-人才战略官/AI产品经理，13年AI、16年互联网经验；社群“”（9年）和自媒体“hanniman”（12年）；作品有《》、「黄钊的AI日报」。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.