网易首页 > 网易号 > 正文 申请入驻

Karpathy:别再问AI「你怎么看了」,这是错误的提示词策略!

0
分享至


↑阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新

Andrej Karpathy对于如何理解和与LLM交互最新观点

他提出一个核心观点:不要把大语言模型看作是实体,而应视作模拟器

这一视角的转变,直接影响着用户与AI交互的方式和效果

Karpathy建议,当人们想要探索某个话题时,应该避免使用这样的提问方式:

“关于xyz,你怎么看?”

原因很简单:根本就没有“你”存在。

Karpathy认为,大模型并没有像人类那样,随着时间的推移对某个话题进行思考并形成自己的观点。

如果用户强行使用“你”来提问,LLM会根据其微调数据的统计规律,采用一个隐含的 “个性嵌入向量”(personality embedding vector),并基于此进行模拟回复。虽然这样做也没问题,但Karpathy指出,这其中的神秘感远没有人们通常认为的询问AI那么高

更有效的提问策略

基于模拟器的定位,Karpathy给出了一种更优的Prompt策略:

“什么样的一群人适合探索xyz话题?他们会怎么说?”

通过这种方式,用户可以让LLM引导或模拟多种视角,而非局限于单一的、被统计数据塑造的“AI人格”


关于AI人格的工程化本质

针对卡帕西的观点,有网友提出了一个反直觉的问题:模型难道不会采取回报率最高的个性吗?这就意味着它会表现得像该领域最适合回答该问题的专家

对此,Karpathy承认,确实存在针对“你”这一模拟维度的工程化工作。

目前,通过SFT(监督微调)和RLHF(人类反馈强化学习),开发者正在努力构建一个能够获得高奖励、赢得用户或裁判模型点赞、或者模仿特定响应风格的“个性”。这确实产生了一种涌现出的复合人格

但Karpathy强调,这种“你”是被刻意设计、工程化并硬加上去的

它本质上仍然建立在一个Token模拟引擎之上,而不是一个随着时间推移、以普通人可理解的方式构建起来的、具有涌现性的“心智”

可验证与不可验证领域

Karpathy最后指出,在不同领域,这种区别的影响不同:

在可验证领域(如数学、编程):情况相对简单,专家视角的模拟通常是准确的。

在不可验证领域(如询问对某话题的观点/意见):情况则变得更加有趣且复杂。

在后一种情况下,用户很难搞清楚正在与之对话的这个“你”究竟是谁,它来自哪里,以及应该给予它多大的信任度


验证

直接上手验证一下,用Karpathy建议的Prompt策略,来解析Karpathy以上观点

提问:


LLM(Gemini 3 pro)的回答:

为了深入探讨“LLM是模拟器而非实体”这一论题,最适合组成的虚拟圆桌会议应该包含以下几类人:深度学习理论家、认知科学家、RLHF(人类反馈强化学习)一线工程师以及高阶提示词专家

假如他们聚在一起,针对Karpathy的观点,他们会分别这样说:

1. 深度学习理论家(The Deep Learning Theorist)

视角核心:统计学与概率分布

Karpathy切中了要害。从数学本质上看,模型只是在多维空间中学习数据分布。所谓的‘回答’,本质上是从巨大的概率分布中进行的条件采样(Conditional Sampling)

当你问‘你怎么看’时,模型并不是在调动一个内在的自我意识中心,它只是在计算:在海量的互联网文本中,当出现‘你怎么看’这种句式时,后面接什么Token的概率最高。它模拟的是‘互联网上的平均回答者’或者‘微调数据中定义的理想助手’。确实不存在一个物理的或心理的‘实体’在思考

2. RLHF工程师(The Alignment Engineer)

视角核心:工程实现与奖励机制

关于‘硬加’和‘工程化’这一点,我们最清楚。底座模型就像是一个疯狂的梦境生成器,它能模拟莎士比亚,也能模拟代码,或者模拟网络喷子。

我们通过RLHF给它套上了一个面具。那个彬彬有礼、总是说作为一名人工智能语言模型……’的‘你’,确实是我们为了安全和有用性,通过奖励模型硬生生训练出来的特定行为模式。Karpathy说得对,这只是一层薄薄的界面,底下仍然是那个通用的Token模拟引擎

3. 认知科学家/心灵哲学家(The Cognitive Scientist)

视角核心:主体性(Agency)与时间连续性

关键在于Karpathy提到的时间和形成观点。人类的我建立在记忆的连续性和与世界持续交互的经验之上

LLM是无状态的。每一次对话对它来说都是全新的开端,没有过去,也没有未来。它没有随着时间推移去在这个世界上生活,因此它不可能拥有像人类那样基于生活经验累积而成的观点。它是在模拟一个拥有观点的人类会说出的话,这在本体论上与拥有观点是两回事

4. 高阶提示词专家(The Prompt Engineer)

视角核心:实用主义与上下文激活

从实操角度看,把LLM当作‘模拟器’能让性能提升一个量级

如果我问‘你怎么看这行代码’,它可能会给出一个平庸的、通过RLHF对齐的通用解释。但如果我按照Karpathy的逻辑,把它设定为‘模拟一位资深的Linux内核维护者’,它就会调用训练数据中那部分特定的、高权重的专业知识分布

承认‘没有你’,反而让我们能更自由地定义‘你是谁’,从而榨出模型的最强性能。”

总结这群人的共识:

他们会一致认为,Karpathy不仅是在纠正称呼,更是在揭示大模型“变色龙”的本质。“你”是一个被训练出来的用户界面,而“模拟器”才是这台机器真正的操作系统

非常有意思,建议大家也尝试一下,小小的一个提示词策略改变,可能会让你获得对某个topic更好的理解

--end--

最后记得⭐️我,这对我非常重要,每天都在更新:

欢迎点赞转发推荐评论,别忘了关注我

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

锋哥与八卦哥
2026-01-25 13:26:51
震惊全球!新机官宣:2月18日,正式发布登场!

震惊全球!新机官宣:2月18日,正式发布登场!

科技堡垒
2026-01-24 12:37:22
向太唱衰李亚鹏!称全民拯救也没用,李亚鹏没能力又烂好心是硬伤

向太唱衰李亚鹏!称全民拯救也没用,李亚鹏没能力又烂好心是硬伤

离离言几许
2026-01-24 00:01:10
知名制片人姜莹莹被腾讯解聘,移送公安局,给出的原因太恶劣!

知名制片人姜莹莹被腾讯解聘,移送公安局,给出的原因太恶劣!

一盅情怀
2026-01-25 15:54:20
国安部“点名”张艺谋,释放三个强烈信号,原来我们确实低估他了

国安部“点名”张艺谋,释放三个强烈信号,原来我们确实低估他了

生命之泉的奥秘
2026-01-25 06:30:36
连爆5场!对手害怕谢泼德,阿门赛后发出请求,而乌度卡也明牌了

连爆5场!对手害怕谢泼德,阿门赛后发出请求,而乌度卡也明牌了

巴叔GO聊体育
2026-01-25 16:00:42
重大转向!美国发布最新国防战略报告:特朗普总统寻求与中国建立稳定的和平、公平的贸易以及互相尊重的关系

重大转向!美国发布最新国防战略报告:特朗普总统寻求与中国建立稳定的和平、公平的贸易以及互相尊重的关系

每日经济新闻
2026-01-25 09:56:41
乌克兰没想到,当年高价卖给中国的三架破飞机,如今却成大国重器

乌克兰没想到,当年高价卖给中国的三架破飞机,如今却成大国重器

小涛叨叨
2026-01-25 17:35:39
新加坡急了!在东盟的会上,中国“尊重”马六甲的地位!

新加坡急了!在东盟的会上,中国“尊重”马六甲的地位!

福建平子
2026-01-25 09:20:29
美新版国防战略出现“重大转变”

美新版国防战略出现“重大转变”

参考消息
2026-01-24 19:37:03
宋军继辞去山东省副省长职务

宋军继辞去山东省副省长职务

新京报政事儿
2026-01-25 20:14:18
鱼的生长周期好像也没多长时间,为啥长江禁渔要长达10年?

鱼的生长周期好像也没多长时间,为啥长江禁渔要长达10年?

向航说
2026-01-18 00:50:03
大家坐稳扶好了,下周周一周二周三三天,牛市或将再次主升浪!

大家坐稳扶好了,下周周一周二周三三天,牛市或将再次主升浪!

夜深爱杂谈
2026-01-25 18:36:13
就在今天!努尔基奇打破尘封51年的纪录,登顶爵士队史第一

就在今天!努尔基奇打破尘封51年的纪录,登顶爵士队史第一

篮球大视野
2026-01-25 15:23:19
有人预测:明后年,二三十层电梯房,或将面临这3个结局,太真实

有人预测:明后年,二三十层电梯房,或将面临这3个结局,太真实

平说财经
2026-01-24 00:03:37
央八开播!胡歌领衔!40集大剧来了,看完阵容,我想说:这剧要爆

央八开播!胡歌领衔!40集大剧来了,看完阵容,我想说:这剧要爆

草本纪年
2026-01-25 19:11:36
破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

另子维爱读史
2026-01-16 21:03:12
68岁大妈喜欢睡前泡脚,不久脑梗去世,医生怒斥:太无知了

68岁大妈喜欢睡前泡脚,不久脑梗去世,医生怒斥:太无知了

医学科普汇
2025-12-13 16:40:05
重兵包抄伊朗,特朗普要打了?普京已通告俄将出手,中方也有行动

重兵包抄伊朗,特朗普要打了?普京已通告俄将出手,中方也有行动

科普100克克
2026-01-24 18:11:51
皇马1.8亿巨星上位!新帅力挺,比阿隆索公正,双核战术成亮点

皇马1.8亿巨星上位!新帅力挺,比阿隆索公正,双核战术成亮点

阿泰希特
2026-01-25 12:36:17
2026-01-25 21:24:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1028文章数 395关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

加拿大华人医生夫妇携幼女到上海求医 花16万保下脾脏

头条要闻

加拿大华人医生夫妇携幼女到上海求医 花16万保下脾脏

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

教育
游戏
健康
亲子
数码

教育要闻

小学霸发来的题,不知道到底是考验我,还是向我求教

《鬼武者》25周年纪念贺图!这些角色你能认全吗?

耳石脱落为何让人天旋地转+恶心?

亲子要闻

爸爸今天给孩子们做美味的火锅盲盒大餐

数码要闻

网购微星RTX 5090显卡却收到浴巾裹石头,网友分享被骗经历

无障碍浏览 进入关怀版