网易首页 > 网易号 > 正文 申请入驻

知识工作新范式:从人机协作到人机分工

0
分享至

昨晚睡前你写了一段文字,描述想要什么、怎么算达成。今早醒来,AI已经完成了100轮实验——尝试方案、测量结果、淘汰失败、继续迭代。你没有执行任何一步研究,只是设计了一个目标。

这不是假设。这是Andrej Karpathy本周发布的"autoresearch"项目。


技术细节对工程师有吸引力,战略意义对所有人更重要。前者我们花一段,后者花全文。


Karpathy搭建了一个围绕AI训练任务的自主研究循环:给智能体一个目标、可修改的代码库、单一优化指标。智能体提出改动、运行短实验、评估指标是否提升、保留胜者、淘汰其余、重复。约100个循环在一夜之间完成,任何带GPU的现代Mac都能跑。人类唯一的贡献是一份描述研究方向的文档——优化什么、约束条件、什么算进步。

创业者Garry Tan的概括更精炼:"设计竞技场,让AI迭代。"

这句话抓住了核心。但多数讨论忽略了一点:Karpathy的竞技场是针对模型训练,但这个策略适用于任何能精确定义"更好"的领域。这不是小众场景,这是大部分知识工作。

自主AI循环并非新事物。2025年Geoffrey Huntley推广的"Ralph Wiggum"模式结构类似:简单循环,给AI智能体一个提示,每轮后检查完成条件,直到任务结束。测试通过、构建成功、清单项清零。Ralph Wiggum是AI智能体的while (not done)循环——广泛使用,对任务完成确实有效。

Autoresearch增加了一个升级要素:不是"继续尝试,这是判断完成的方式",而是"这是要优化的指标……持续调整,保留让指标比以前更好的方案"。可称之为Ralph Wiggum Plus。


Ralph Wiggum问"完成了吗?",答案是就停。Ralph Wiggum Plus问"比以前更好吗?",只要还能改进就继续搜索。区别听起来微妙,实则不然。二元检查在有明确终点线时完美工作——很多任务确实有明确终点。连续指标适用于优化目标——没有终点线,只有不断刷新的分数。

这是知识工作策略的进化:从Human-In-the-Loop(人在回路中,每一步参与)到Human-Before-the-Loop(人在回路前,只设计竞技场)。人负责定义"更好"的标准,机器负责寻找更好的路径。

这个转变的边界值得警惕。指标必须真正反映价值,而非-proxy(代理指标)。否则AI会优雅地优化错误的东西——这是Goodhart定律的老问题,只是现在循环速度是100轮/夜。定义竞技场的人,责任比执行的人更重。

Karpathy的项目是技术演示,也是工作方式的预告。当优化类任务可以交给机器通宵迭代,人类的核心技能变成:提出正确的问题、设计有效的测量、判断何时停止。这些都不是新能力,但它们的权重正在急剧上升。

竞技场设计者的时代开始了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
局地暴雨!新疆多地将迎强降水!

局地暴雨!新疆多地将迎强降水!

新浪财经
2026-06-04 08:04:31
国内套现7个亿后,她露出了身后的美国国旗,整个家族共套现20亿

国内套现7个亿后,她露出了身后的美国国旗,整个家族共套现20亿

搜史君
2026-05-12 06:00:20
月薪四千养不起一场恋爱?女生收到男友9000块转账,她看备注哭了

月薪四千养不起一场恋爱?女生收到男友9000块转账,她看备注哭了

捣蛋窝
2026-06-04 05:54:56
北京今天最高气温24℃,有分散性雷阵雨,局地阵风七级左右

北京今天最高气温24℃,有分散性雷阵雨,局地阵风七级左右

北青网-北京青年报
2026-06-04 08:18:06
西方长大的华人孩子,回国读了2年高中后,这样评价中国

西方长大的华人孩子,回国读了2年高中后,这样评价中国

鹤羽说个事
2026-06-02 23:06:20
问界回应M9起火事故!上热搜!

问界回应M9起火事故!上热搜!

电动知家
2026-06-03 17:53:26
“无儿无女”现象席卷全国,7000万女性无后代,这个死局怎么破?

“无儿无女”现象席卷全国,7000万女性无后代,这个死局怎么破?

探源历史
2026-06-03 00:13:51
省教育厅发文:高校横向科研项目普遍存在问题,倒查 3 年

省教育厅发文:高校横向科研项目普遍存在问题,倒查 3 年

生物学霸
2026-06-02 17:13:48
选秀抽签巨变,火箭队成受益者?明年太阳篮网签,顺位或大幅前提

选秀抽签巨变,火箭队成受益者?明年太阳篮网签,顺位或大幅前提

熊哥爱篮球
2026-06-03 19:19:19
法国特种兵突袭11万吨俄罗斯油轮,不到24小时,普京政府准时断供

法国特种兵突袭11万吨俄罗斯油轮,不到24小时,普京政府准时断供

小小科普员
2026-06-03 14:54:50
德转列英格兰球员累积转会费排行榜:贝林第1,戈登1.26亿第2

德转列英格兰球员累积转会费排行榜:贝林第1,戈登1.26亿第2

懂球帝
2026-06-03 18:59:25
百年联排老别墅被“掏空”!住户紧急撤离,房主获刑,阿婆:谁来赔我们?

百年联排老别墅被“掏空”!住户紧急撤离,房主获刑,阿婆:谁来赔我们?

环球网资讯
2026-06-02 19:39:41
中美俄英法都在名单里,印媒公开喊话环球时报:凭啥就没有印度?

中美俄英法都在名单里,印媒公开喊话环球时报:凭啥就没有印度?

福建睿平
2026-06-03 08:03:32
“最干净女演员”被富商苦追10年才嫁,如今和女儿被宠如宝

“最干净女演员”被富商苦追10年才嫁,如今和女儿被宠如宝

吃青菜长高
2026-05-26 16:31:47
南京没有自己的本土航空,却忙着修T3航站楼,这里面的玩法堪称完美

南京没有自己的本土航空,却忙着修T3航站楼,这里面的玩法堪称完美

中国民航人
2026-06-03 14:05:21
退休金只要达到这个数!你已经超过95%的人了!

退休金只要达到这个数!你已经超过95%的人了!

三农老历
2026-06-04 06:02:25
54岁吴越下厨被拍,单身生活细节让无数人沉默

54岁吴越下厨被拍,单身生活细节让无数人沉默

天马幸福的人生
2026-05-31 14:54:35
2027年,如果房价持续下跌,中国50%的家庭或将面临3个大麻烦

2027年,如果房价持续下跌,中国50%的家庭或将面临3个大麻烦

离离言几许
2026-06-02 18:07:50
中年女人对你动情的4个信号:不拒绝就是喜欢你,别不懂

中年女人对你动情的4个信号:不拒绝就是喜欢你,别不懂

娱乐洞察点点
2026-06-04 08:07:23
日菲启动海域划界,赖清德不吭一声挨轰:台湾地区人尽可欺

日菲启动海域划界,赖清德不吭一声挨轰:台湾地区人尽可欺

海峡导报社
2026-06-03 09:58:07
2026-06-04 09:31:00
碳基打工人
碳基打工人
坐标北京,靠咖啡续命,靠小红书下饭的普通人类。
4529文章数 43关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

215票对208票 美众议院要求特朗普停止动武并撤军

头条要闻

215票对208票 美众议院要求特朗普停止动武并撤军

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

SpaceX发行价135美元 6月12日上市交易

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

教育
游戏
时尚
数码
房产

教育要闻

中外合作办学,有个怪事!

《战神:劳菲》官方情报 世界背景和战斗系统介绍

粗腿宽肩,正在成为中女审美新风向

数码要闻

郭明錤称苹果AR眼镜将取代Vision Pro 带屏版2029年问世

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

无障碍浏览 进入关怀版