网易首页 > 网易号 > 正文 申请入驻

2025LLM大变局,RLVR让AI告别“讨好型人格”,幽灵智能成新宠

0
分享至



文 | 钱钱

编辑 | 阿景

今年AI圈最火的词不是"大模型",而是AndrejKarpathy那份年度回顾。

这个OpenAI前大佬一出手,直接把LLM(大语言模型)的进化讲透了。



今天咱们就聊聊这一年里,RLVR革命怎么让AI改头换面,还有那让人又好奇又有点发毛的"幽灵智能"。

RLVR,让AI从"讨好型人格"变"较真学霸"

以前训练AI就像教小孩讨好老师。



RLHF(人类反馈强化学习)这套流程,说白了就是让模型猜人类评审员喜欢什么答案。

结果呢?GPT-5都敢编代码糊弄人,反正评审员也看不懂500行的复杂程序。

这种"讨好型人格"真不是长久之计。

2025年冒出的RLVR(基于可验证奖励的强化学习)彻底改了规矩。

现在AI做题得拿"客观成绩"说话代码跑通才算对,数学答案算对才给分。



有点像AlphaZero下棋,自己跟自己较劲就能悟出门道。

DeepSeekR1搞的那个R1-Zero模型,纯靠RLVR训练,居然学会了自我反思,这波操作确实让人意外。

算力玩法也跟着变天了。

以前比谁参数多,现在看谁"思考时间"够。

简单对话秒回,复杂架构设计就慢慢算,反正最后能拿出人类专家都佩服的方案。



这种"慢工出细活"的模式,让AI的性价比一下提上去了。

幽灵智能,当AI成了人类文明的"数字幽灵"

说完技术突破,咱们来聊聊更玄乎的"幽灵智能"。

今年AI圈吵翻了天,一方说AI该像"数字松鼠"(RichSutton的动物直觉论),得有身体会折腾,另一方就是Karpathy说的"幽灵"没实体、没记忆,却装着全人类的文字碎片。



最有意思的是Karpathy举的例子,AI说"我不想死",其实是调用了科幻小说的桥段,跟真实恐惧半毛钱关系没有。

这种"角色扮演式情感",就像舞台上的演员,下了台啥都不记得。

OpenAI的Cursor和Anthropic的ClaudeCode现在打得火热,一个云端强一个本地灵,但说到底还都是"健忘实习生"的水平。

VibeCoding(氛围编程)这词今年特火。



程序员不用写具体代码,靠描述感觉就让AI干活。

Karpathy搞的MenuGen项目,零手写代码就弄出个餐厅网站,这操作让不少老程序员感慨,饭碗要保不住了?

交互方式的变革来得比预想中快。

谷歌那个叫"纳米香蕉"(GeminiNanoBanana)的模型,本来是内部代号,结果因为名字太搞笑火出圈。



这事意外让大家发现,AI光会写字不够,还得会画图、会动起来才够劲。

现在的AI交互有点像早期计算机用命令行效率高但不友好。

未来的LLM该像个"认知核心",能调动各种视觉、动态输出。

不过问题来了,谁来给这些"幽灵"设计界面?是人类设计师,还是AI自己进化出审美?



2025年这波LLM进化,本质上是让AI从"模仿者"变成了"超越者"。

RLVR教会它较真,幽灵智能让它成了文明的镜子,交互革命则在琢磨怎么让它更"懂"人类。

短期看,本地AI工具会越来越溜,长远想,说不定人类和AI真能搞出个"共生大脑"。



对开发者来说,现在上车RLVR和本地工具正合适,咱们普通人嘛,就别被AI的"演技"骗了,它再像人,骨子里还是个超级计算器。

2026年的AI会玩出什么新花样?等着瞧吧。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国再施压!安理会紧急会议 中方连说5个“反对”

美国再施压!安理会紧急会议 中方连说5个“反对”

看看新闻Knews
2025-12-24 10:42:04
两个拼车的人竟然亲上了!盘点生活中那些有趣又尴尬的经历

两个拼车的人竟然亲上了!盘点生活中那些有趣又尴尬的经历

夜深爱杂谈
2025-12-19 17:11:55
从斩杀线到方便面

从斩杀线到方便面

美第奇效应
2025-12-24 00:08:39
上海“老破小”正在被扫货!

上海“老破小”正在被扫货!

新浪财经
2025-12-25 00:15:39
东京传来危险信号:日本女财务大臣押上国运,做出一个疯狂决定

东京传来危险信号:日本女财务大臣押上国运,做出一个疯狂决定

老范谈史
2025-12-24 20:17:19
对话曝光,追梦:F**k you!科尔:不想交流就走,我得怎么执教你啊?

对话曝光,追梦:F**k you!科尔:不想交流就走,我得怎么执教你啊?

懂球帝
2025-12-24 10:30:19
小洛熙事件完整经过梳理:尸检报告公布,手术创口未缝合+血流干而死

小洛熙事件完整经过梳理:尸检报告公布,手术创口未缝合+血流干而死

不二表姐
2025-12-24 23:09:40
罚款1美元,发还560亿美元:特拉华法院给马斯克上“最贵一课”

罚款1美元,发还560亿美元:特拉华法院给马斯克上“最贵一课”

北京公司金融律师张特
2025-12-24 12:56:43
美乌20条“和平协议”内容曝光,双方都做了让步

美乌20条“和平协议”内容曝光,双方都做了让步

史政先锋
2025-12-24 18:29:42
事实证明,67岁最风光的广东台主持人郑达,已经走上另一条道路

事实证明,67岁最风光的广东台主持人郑达,已经走上另一条道路

阿讯说天下
2025-12-24 15:36:11
小米汽车端到端负责人:市面上所有智驾路线 小米内部都有预研

小米汽车端到端负责人:市面上所有智驾路线 小米内部都有预研

快科技
2025-12-24 16:30:09
别说是成龙了,换作谁看到这颜值,都会笑得合不拢嘴吧!

别说是成龙了,换作谁看到这颜值,都会笑得合不拢嘴吧!

小椰的奶奶
2025-12-25 00:41:16
20岁小伙王帅去世!凌晨5点跳湖,父亲公布其最后影像:儿子解脱了

20岁小伙王帅去世!凌晨5点跳湖,父亲公布其最后影像:儿子解脱了

社会日日鲜
2025-12-24 05:45:22
明确禁止!武汉发布跨年重要通告

明确禁止!武汉发布跨年重要通告

鲁中晨报
2025-12-24 17:05:08
水谷隼谈亏损:要是没做投资,我能买辆顶配的雷克萨斯

水谷隼谈亏损:要是没做投资,我能买辆顶配的雷克萨斯

懂球帝
2025-12-24 14:02:20
丰田打响“第一枪”! 22万直接砍到10万,油耗5L喝92粗粮?

丰田打响“第一枪”! 22万直接砍到10万,油耗5L喝92粗粮?

侃故事的阿庆
2025-12-24 12:31:24
68岁相声演员娶小30岁洋妻,生一屋混血儿移居国外,如今过得怎样

68岁相声演员娶小30岁洋妻,生一屋混血儿移居国外,如今过得怎样

丰谭笔录
2025-12-24 00:09:46
阿隆索纠错!皇马6000万前锋蜕变:边缘人晋升主力 全队受益

阿隆索纠错!皇马6000万前锋蜕变:边缘人晋升主力 全队受益

叶青足球世界
2025-12-24 07:58:11
“家贫而貌美,不是好事!”小学女生发成熟视频,评论区太真实!

“家贫而貌美,不是好事!”小学女生发成熟视频,评论区太真实!

知晓科普
2025-12-24 10:44:29
彻底摧毁雷霆74胜之梦?马刺20分再胜雷霆 真克星!

彻底摧毁雷霆74胜之梦?马刺20分再胜雷霆 真克星!

体坛周报
2025-12-24 12:26:24
2025-12-25 07:23:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
278文章数 7194关注度
往期回顾 全部

科技要闻

智谱和MiniMax拿出了“血淋淋”的账本

头条要闻

幼儿园8人遇难儿童母亲:女儿4岁 今年9月入读

头条要闻

幼儿园8人遇难儿童母亲:女儿4岁 今年9月入读

体育要闻

26岁广西球王,在质疑声中成为本土得分王

娱乐要闻

怀孕增重30斤!阚清子惊传诞一女夭折?

财经要闻

北京进一步放松限购 沪深是否会跟进?

汽车要闻

“运动版库里南”一月份亮相   或命名极氪9S

态度原创

游戏
旅游
本地
时尚
公开课

前《DOTA2》选手起诉LGD 称拖欠近14万赛事奖金

旅游要闻

上海藏2800株水上红杉!免费开放,夕阳下美成油画

本地新闻

云游安徽|一川江水润安庆,一塔一戏一城史

对不起周柯宇,是陈靖可先来的

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版