网易首页 > 网易号 > 正文 申请入驻

别再问什么工作被AI取代!Karpathy直指本质:你的工作「可验证」吗?

0
分享至

  

  新智元报道

  编辑:peter东

  【新智元导读】当整个科技界还在为「AGI何时到来」激烈争辩时,前特斯拉AI负责人Andrej Karpathy悄然抛出一枚思想炸弹:「软件1.0自动化你能指定的任务;软件2.0自动化你能验证的任务。」

  如果说PC时代的革命,是让每个人都能「用上计算机」,那么大模型时代的革命,则是第一次让计算机自己学会「写程序」。

  从软件1.0到软件2.0,人类不再负责穷举规则,而是只需给出一个清晰的目标,让神经网络在巨大的可能性空间中试错、迭代、收敛。

  在这场悄然进行的范式跃迁中,一个新的判断标准浮出水面:一项任务能否被 AI 接管,不再取决于它是否机械重复,而取决于它是否满足「可重置、可高效试错、可自动奖励」这三条准则。

  最近,Karpathy分享了关于AI对经济影响的有趣对话。

  

  计算范式跃迁

  如果回到1980年代,个人计算机刚刚出现,你要预测其对就业市场的影响,最需要关注的任务/工作流程是否固定,是否遵循指定的简单规则机械地进行信息处理,例如打字员,速记员等。

  

  这是在因为那个时代,开发者必须手动编写程序,为此他需要知道程序中的每一步要做什么。

  这一时代出现的软件1.0,只能自动化可以明确定义的信息处理流程

  如果你只知道达成一个任务的目标,但却说不出该如何达到,那在AI成熟之前,这样依靠经验或直觉的任务将无法进行通过编程自动化。

  而到了机器学习,尤其是大模型技术成熟之后,开发者只需要指定信息处理的最终目标(例如分类精度、奖励函数),并通过梯度下降搜索可能性空间,就可以找到在目标上表现良好的神经网络。

  

  在这个新的编程范式(软件2.0)下,开发者不需要预先知道程序中每一步要怎么做。

  因此,要判断一个任务能否被自动化,最具有预测性特征变成了可验证性

  如果一个任务是可验证的,那么它可以通过强化学习进行优化,并且可以训练神经网络,在该任务上表现出色。

  什么样的任务是可验证,有下面3条标准,分别是

  1 环境可重置(可以开始新的尝试)

  2 试错成本低(可以进行大量尝试)

  3 可奖励(存在某种自动过程来奖励任何特定的尝试)

  3条都满足,AI便能像围棋少年日复一日打谱——只是它的「一天」,是百万局自我对弈。

  不同于AI被比作各种历史先例,如电力、工业革命等,Karpathy给出的类比是将AI视为一种新的计算范式(Software 2.0)。

  

  软件1.0和2.0都是关于数字信息处理的自动化,区别只是自动化的范围

  相比将AI与工业革命类比,这无疑是一种直指内核的直觉增强器。

  AI「快车道」

  高可验证性任务

  有了可验证这样一个可操作、可检验、可落地的评估框架,就能明白为何Copilot能写代码却编不出《百年孤独》,为何AlphaFold能预测蛋白结构却当不了院士——

  答案不在算力多强,而在任务本身的「可验证性」。

  举例来说,不论是下象棋,下围棋,还是在星际争霸这样的多人实时战略游戏中获胜,都满足可验证性的三条判别标准,因此已经被AI逐个击破、

  在代码生成与修复上,当前大模型超越了普通程序员,这同样是因为编程任务具有可验证性:解释器可检查语法正确性,单元测试可自动验证逻辑正确性,静态分析工具可检测潜在bug,性能优化时也有内存占用,CPU时间等明确的指标。

  

  除此之外,看看当下AI取得突破的应用场景,例如数学证明,结构化信息提取,问答与事实核查(Jeopardy类的常识问答)等,都是有明确的评价指标的,可实时打分,且答错也影响不大。

  而那些AI表现得还可以的任务,则是在可验证性的3条标准中,有部分满足

  例如机器翻译,的确存在一些测试算法用的金标准,但语义流畅性,跨文化的语义迁移难以量化,需人工校准,不存在能自动打分的奖励体系,因此机器翻译的也只是能准确,却难以言辞优美典雅。

  另一个部分可验证的例子是,使用Alphafold进行蛋白质结构预测。

  虽然蛋白结构可通过实验(如冷冻电镜)最终验证,但计算过程本身不可实时奖励,环境无法重置,只能依赖对已有数据库的监督学习,这导致Alphafold还不能完全取代实验方法。

  低可验证性任务

  人类的「护城河」,还是暂时的喘息?

  至于Karpathy列出的难以验证的任务,AI也表现较差。

  例如,小说创作中什么是「好故事」?并无客观标准。

  在战略决策,例如选创业方向、并购判断等问题上,反馈延迟数年,不可重置。当前有尝试将AI用于心理咨询,但疗效受主观感受影响,同样难以量化。在这些任务上。

  目前,AI还完全无法达到可接受的水平。

  按照可验证性这一标准,CEO将难以被人工智能取代。

  CEO的工作更具主观性,他们需要在很长时间内做出数百个决策。虽然这项工作可以有可衡量的回报(最大化股东价值),但它不可重置(CEO不能撤销他们的决策并重新开始)也不高效(公司运行迭代数百次将花费太长时间)。

  不过,可验证性低的任务中,也有一部分可以被外包给AI,例如科学研究中的可验证部分是文献检索、数据可视化、论文语法校对,这些任务现在已经逐渐交由AI完成。

  而难以验证的的部分,例如确定研究方向,给出原创的实验方案等,由于「重要性」,「创新」由共同体长期共识决定,这些子任务上则应当由人来执行。

  

  了解了Karpathy的洞见,下次有人问起AI会不会取代人类时,你就可以指出只要一项任务还不满足可验证的3条指标,那AI肯定做不好,若3条指标中有部分不满足,那AI的表现也难以超越人类。

  而这意味着在未来十年,最大的职业风险不在于你做什么工作,而在于你的工作能否被拆解出足够多的可重置-高效-可奖励子任务

  软件2.0时代,人类的价值不再是执行者,变成了创造意义(例如在小说中设计人物弧光,升华主题),以及架构设计(例如为企业运营创立更多维度更全面的评估标准)。

  当AI在可验证的高原上疾驰,人类的使命,便是不断为它点亮下一座灯塔,并永远守护那片不可验证的、属于惊奇、犹疑与自由的深海。

  参考资料:

  https://x.com/karpathy/status/1990116666194456651?s=20

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
后妈怂恿我爸停了我的生活费,我打电话给远在国外的外公

后妈怂恿我爸停了我的生活费,我打电话给远在国外的外公

五元讲堂
2026-01-04 11:16:58
“佐香园辽宁”被拘!

“佐香园辽宁”被拘!

沈阳百姓一家亲
2026-01-13 00:11:56
闫学晶发文致歉:我讨厌那个下意识里露出轻视的自己

闫学晶发文致歉:我讨厌那个下意识里露出轻视的自己

红星新闻
2026-01-11 21:29:38
徐达常遇春他们都是农民,为何起义后却成了军事天才?原因很现实

徐达常遇春他们都是农民,为何起义后却成了军事天才?原因很现实

铭记历史呀
2026-01-10 13:09:37
陈赫前妻许婧和匈牙利老公在沙特庆生,39 岁身材超棒,太吸睛。

陈赫前妻许婧和匈牙利老公在沙特庆生,39 岁身材超棒,太吸睛。

乡野小珥
2025-12-23 05:38:57
果然在春晓油田动手了!日本对中方强烈抗议,要求马上谈判!

果然在春晓油田动手了!日本对中方强烈抗议,要求马上谈判!

百态人间
2026-01-12 16:32:07
6-2!斯诺克大师赛8强已出其四:中国选手三连胜,赵心童首战告捷

6-2!斯诺克大师赛8强已出其四:中国选手三连胜,赵心童首战告捷

郝小小看体育
2026-01-13 05:31:31
皇马队内已有17人发文告别阿隆索,维尼修斯、贝林等尚未发声

皇马队内已有17人发文告别阿隆索,维尼修斯、贝林等尚未发声

懂球帝
2026-01-13 08:57:05
合川杀猪饭后续:女子命运改变,名不符实根本不呆,网友仙人指路

合川杀猪饭后续:女子命运改变,名不符实根本不呆,网友仙人指路

呼呼历史论
2026-01-12 12:31:28
1980年,王光美拿过追悼会名单,狠狠划掉几人,却添上个正在挨整的将军:他对咱家有恩

1980年,王光美拿过追悼会名单,狠狠划掉几人,却添上个正在挨整的将军:他对咱家有恩

源溯历史
2026-01-07 19:28:08
成龙砸4000万认回女儿,房祖名悄悄帮忙,林凤娇沉默

成龙砸4000万认回女儿,房祖名悄悄帮忙,林凤娇沉默

草莓解说体育
2026-01-13 02:23:05
她不愿意被潜规则,演了近百部戏观众却叫不出她名字,42岁仍单身

她不愿意被潜规则,演了近百部戏观众却叫不出她名字,42岁仍单身

丁丁鲤史纪
2025-12-27 16:10:28
甜茶30岁夺金球影帝!五提终圆梦,击败小李子吻女友致谢

甜茶30岁夺金球影帝!五提终圆梦,击败小李子吻女友致谢

情感大头说说
2026-01-13 10:00:00
66岁张维迎隐居山沟,六年培育150企业家

66岁张维迎隐居山沟,六年培育150企业家

咸鱼金脑袋
2025-12-30 22:32:24
仅17分钟 两市成交额突破1万亿

仅17分钟 两市成交额突破1万亿

财联社
2026-01-13 09:50:12
男孩打开冰箱,发生爆炸脸上缝了38针!这几样东西放冰箱要小心

男孩打开冰箱,发生爆炸脸上缝了38针!这几样东西放冰箱要小心

大果小果妈妈
2026-01-10 21:57:26
英雄,林昀儒赢了!张本智和不服气:自己有实力拿男单冠军

英雄,林昀儒赢了!张本智和不服气:自己有实力拿男单冠军

开成运动会
2026-01-12 19:51:34
布鲁克林·贝克汉姆向父母大卫和维多利亚发出法律信函,家庭矛盾加剧

布鲁克林·贝克汉姆向父母大卫和维多利亚发出法律信函,家庭矛盾加剧

小椰的奶奶
2026-01-12 06:10:14
钱再多有什么用?有一个朋友,今年42岁, 存款有700万元

钱再多有什么用?有一个朋友,今年42岁, 存款有700万元

时尚的弄潮
2026-01-07 10:00:25
游客称在西湖边散步时被松鼠咬伤,花1300多元打狂犬疫苗,官方:正核查,建议游客与松鼠保持距离

游客称在西湖边散步时被松鼠咬伤,花1300多元打狂犬疫苗,官方:正核查,建议游客与松鼠保持距离

大风新闻
2026-01-12 18:25:03
2026-01-13 10:36:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14320文章数 66456关注度
往期回顾 全部

科技要闻

每年10亿美元!谷歌大模型注入Siri

头条要闻

牛弹琴:伊朗局势突然反转 特朗普又心生一计非常生猛

头条要闻

牛弹琴:伊朗局势突然反转 特朗普又心生一计非常生猛

体育要闻

一场安东尼奥式胜利,给中国足球带来惊喜

娱乐要闻

蔡少芬结婚18周年,与张晋过二人世界

财经要闻

年化400% 高利网贷“变形记”

汽车要闻

增配不加价 北京现代 第五代 胜达2026款上市

态度原创

健康
旅游
亲子
艺术
军事航空

血常规3项异常,是身体警报!

旅游要闻

敦煌灯会“穿越”千年邂逅盛唐繁景

亲子要闻

原来生气可以这么可爱的?傲娇宝宝:那可不咋滴!

艺术要闻

书法争论!妍美与古拙,哪种才是真正的传统?快来参与讨论!

军事要闻

官方确认:歼10CE在空战中击落多架战机

无障碍浏览 进入关怀版