网易首页 > 网易号 > 正文 申请入驻

有多少人没真正用懂AI?掌握这套“反思-重试-奖励”AI工作法

0
分享至

01

在7月26日的上海中国人工智能大会上,腾讯发布了世界大模型、华为发布昇腾384的AI算力系统。

这是我们自己的中国AI基座,作为企业家、投资者,我们如何在AI基座上发挥经营价值,发掘投资价值?真正把AI运用到我们事业中?

02

举个例子,前段时间我在研究投资产品型的企业,平台型企业,还是生态型企业更好?或者是企业在某个阶段更适合投资?

于是,我让大模型帮我整理腾讯、华为、美的等公司从产品型-平台型-生态型的发展过程。

我发现Deepseek说在2016年3Q大战之后,腾讯开始开放战略。

但对于长期研究和投资腾讯的我来说,3Q大战是在2010年。

这就是典型的AI幻觉,我相信大家都碰到过和我一样的大模型错误情况,根据测评结果,DeepSeek-R1模型幻觉率高达21.02%,远远高于豆包大模型的4.11%,也高于DeepSeek另一款大语言模型V3的13.83%。

同时,推理模型的幻觉比非推理模型更严重,推理模型平均幻觉率为22.95%,非推理模型的平均幻觉率为13.52%。

看到这样的幻觉率,你会怎么想?大模型还能用吗?

对于还没有接触大模型的人来说,可能会有这种想法,但是对于在学习工作中,已经大量使用的人来说,看法可能就不太一样了。

就像孩子两岁学走路的时候,三步一摔,你会让他不要再学走路了?趴在地下爬就好了?

所以,我一开始总结了两个方法:

1、AI输出后,让人来调整。2、多个AI大模型之间来取舍。

但尝试过后,我发现,这样的反复调整对效率和效果的提升很有限,AI的潜力应该不止于此。

在继续深入研究后,我在网上看到一篇16页AI论文,找到了提升AI大模型的使用效率和效果的方法。

这篇论文叫《反思,重试,奖励:通过强化学习实现自我改进的大语言模型》。

核心观点,就是让AI像人一样,通过反思,重试,奖励从错误中学习成长!

在论文中,研究员用数学方程进行了实验,阿里通义千问15亿参数的模型在第一次解题的时候,正确率居然只有6%,就像初中数学三元方程100分满分只考了个6分,简直就是个学渣,看到这个结果,估计你是不是觉得大模型就是大忽悠?

接下来,研究员引入“反思机制”训练后,第二次的正确率跃升到了34.9%。

研究员肯定了AI的进步,再让它根据第一次的反思重试一遍,第三次解题成功率提升到45%,有了巨大的跃升。

接下来,还有一个更让我脑洞大开的对比数据。

经过这种“反思,重试,奖励”学习方法训练的小模型,在能力上超过了参数量比自己大十倍的更高级模型。

研究团队用通义千问的70亿参数模型进行训练,结果发现,会“反思”的70亿AI小模型,表现都超过了不会反思的720亿大模型。

这就相当于一个善于反思的中等能力本科生,超过了一个更聪明、知识储备多出十倍、但缺乏反思能力的博士生。

在《腾讯传》写到,2003年一个从金山软件加盟腾讯的产品经理说,金山软件是一年迭代一次,经常出现产品难产和大量bug,而腾讯产品是每月迭代一次。

迭代速度,也决定了两家企业的成长速度,金山软件成立于1988年,比腾讯早了整整十年, 2007年在香港上市,腾讯在2004年香港上市,昨天市值5万亿港币,金山软件是488亿。

雷军在分享自己小米创业经历的时候说,在创业之前,大量研究腾讯、阿里等企业成功经验,所以,小米在做MIUI手机系统的时候,是每周迭代一次。

马化腾把腾讯的产品方法论总结为“小步快跑,试错迭代”,每一次产品的更新都不是完美的,但是如果坚持每天发现、修正一两个小问题,不到一年基本就把一件作品打磨出来了。

03

在AI时代,我身边有些朋友在使用大模型的时候,看到AI的回答有错误,不是重新生成,就是直接放弃,自己来修改。

但经验稍多的研究员,就会给大模型指出明确的错误和调整的方向,例如缺少了对同行的分析、缺少未来三个月可能潜在的风险分析。

所以,在投资研究和产品市场调研上,大模型帮我大幅度提升投研和整理资料的效率,给了我很多独特研究的视角和分析框架。

我公司在运用AI之后也减少50%初级和中级研究员的成本,但是有个大问题,就是数据幻觉非常严重。

比如我搜集新能源车2024年销量,经常出现多个数据失真或者是错误引用,甚至编造名人言论,这是非常致命的。

所以,我们目前让初级研究员用大量时间去完成数据和资料的校验。

当然,对我们更多的人来说,如何去掌握“反思,重试,奖励”的AI工作法,让大模型更好地提升我们的效率和效果?

我总结有五种方式。

1、AI输出后,让人手动来校验数据和资料。

2、逼问大法,先不给出明确的问题,开放式逼问AI问题在哪?例如数据错误,时间错误?让AI自己找出问题来优化。

3、多个AI大模型之间来取舍,可以同时让Deepseek、豆包、元宝混元、kimi进行回答,我一般是把我的身份、问题、结果、格式描述清楚,发给不同AI进行对比,这样就可以取长补短。4、喂饲料:喂给AI高质量的数据,比如给大模型投喂过去五年的腾讯年报,券商研究所的研究报告,行业分析报告,然后根据这些报告,帮我梳理投资报告,这种高质量的一手数据就能大幅减少数据幻觉,回答质量会高很多。

5、也是一种最好的方式,就是用大模型做评委,定出评审标准,来评判其他大模型的报告结果。

我原来只是用前三种,但在借鉴AI工作法的“反思,重试,奖励”后,重点提升4、5的方法,让人类和AI互相学习成长。

就像在人工智能大会上AI深度学习之父、2024年诺奖获得者辛顿说的:大语言模型的学习、思考类似人类大脑,人类与AI的思考终将同频共振。

所以,在接下来的AI时代,我们不用纠结AI是否“能用”,而是专注于如何让它“更有用”,迭代的速度,永远会比初始的聪明更重要。

未来的赢家,一定会属于那些率先学会与AI共思共生的智者。

责任编辑| 罗英凡

图片均来源于网

本文不构成任何投资建议,股市有风险,投资需谨慎

■ 免责声明

本文涉及有关上市公司的内容,为作者依据上市公司根据其法定义务公开披露的信息(包括但不限于临时公告、定期报告和官方互动平台等)作出的个人分析与判断;文中的信息或意见不构成任何投资或其他商业建议,市值观察不对因采纳本文而产生的任何行动承担任何责任。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
31人抢一辆严重受损8400元起拍的小鹏汽车,有人出36800元拍下,法院称车主已在车祸中身亡

31人抢一辆严重受损8400元起拍的小鹏汽车,有人出36800元拍下,法院称车主已在车祸中身亡

极目新闻
2026-04-24 17:49:19
52岁朴树近况:无儿无女,没钱没房,成了要钱不要命的“疯子”

52岁朴树近况:无儿无女,没钱没房,成了要钱不要命的“疯子”

流云随风去远方
2026-04-14 12:22:59
港媒:中国正从伊朗的废墟中汲取关于“持久战”的冷酷经验

港媒:中国正从伊朗的废墟中汲取关于“持久战”的冷酷经验

瞩望云霄
2026-04-24 23:33:38
上海黄浦江中发现人棍女尸,四肢头颅都被砍断,腹中怀有九月男胎

上海黄浦江中发现人棍女尸,四肢头颅都被砍断,腹中怀有九月男胎

奇闻故事汇1989
2024-11-15 21:35:03
忠县惊现特大谋杀案!副县长办公室内惨遭杀害,真相引人深思!

忠县惊现特大谋杀案!副县长办公室内惨遭杀害,真相引人深思!

人生录
2026-04-24 09:13:06
强迫男下属提供性服务,辞职的美国女劳工部长,长得丑可玩的花呀

强迫男下属提供性服务,辞职的美国女劳工部长,长得丑可玩的花呀

华人星光
2026-04-24 11:23:21
持续升级!特朗普改口:“不急于结束伊朗战争”“伊朗没时间了”,以色列:就等美国开绿灯,随时重启战争

持续升级!特朗普改口:“不急于结束伊朗战争”“伊朗没时间了”,以色列:就等美国开绿灯,随时重启战争

纵相新闻
2026-04-25 01:04:12
做一次胃肠镜能保几年平安?消化科医生说出大实话

做一次胃肠镜能保几年平安?消化科医生说出大实话

荷兰豆爱健康
2026-04-24 17:16:33
鲁能门将位置又要迎来新面孔首发!王大雷继续缺阵,已无缘大名单

鲁能门将位置又要迎来新面孔首发!王大雷继续缺阵,已无缘大名单

振刚说足球
2026-04-25 14:09:48
感谢国安!中超新军成联赛黑马,施密特好帮手助刘建业率队5胜2平

感谢国安!中超新军成联赛黑马,施密特好帮手助刘建业率队5胜2平

体坛鉴春秋
2026-04-25 17:12:51
经济围困取代军事打击:特朗普逼伊朗自爆,这招更毒

经济围困取代军事打击:特朗普逼伊朗自爆,这招更毒

高博新视野
2026-04-23 07:30:12
内斗升级,石破茂怒斥高市:继续死磕中国,日本必成下一个战场!

内斗升级,石破茂怒斥高市:继续死磕中国,日本必成下一个战场!

素衣读史
2026-04-25 20:10:38
中超第8轮今晚开打,赛事全预测,有2场可能爆冷

中超第8轮今晚开打,赛事全预测,有2场可能爆冷

林子说事
2026-04-25 17:41:06
明明也走了,初创主播只剩yoyo,一夜爆火出圈的东方甄选只剩回忆

明明也走了,初创主播只剩yoyo,一夜爆火出圈的东方甄选只剩回忆

东方不败然多多
2026-04-25 14:39:14
刘亦菲母亲刘晓莉:今66岁仍单身,身材傲人,长得比女儿还漂亮

刘亦菲母亲刘晓莉:今66岁仍单身,身材傲人,长得比女儿还漂亮

手工制作阿歼
2026-04-25 21:46:28
老詹29+13连创历史第一,湖人5大喜讯因祸得福!2年1100万捡大漏

老詹29+13连创历史第一,湖人5大喜讯因祸得福!2年1100万捡大漏

锅子篮球
2026-04-25 15:29:41
复旦解剖510名糖尿病逝者,意外发现:得糖尿病的人,大多有6共性

复旦解剖510名糖尿病逝者,意外发现:得糖尿病的人,大多有6共性

健身狂人
2026-04-25 17:26:57
749局退休人员自述:秦岭恶龙事件,从发现到斩杀仅用了三天

749局退休人员自述:秦岭恶龙事件,从发现到斩杀仅用了三天

千秋文化
2026-04-10 20:03:43
“核酸大王”张核子背后黑幕被揭露,引发广泛关注!

“核酸大王”张核子背后黑幕被揭露,引发广泛关注!

公子麦少
2026-04-20 22:15:32
楼市大变天!如果不出意外,2026年二手房,价格将迎来4大新变化

楼市大变天!如果不出意外,2026年二手房,价格将迎来4大新变化

爱看剧的阿峰
2026-04-25 03:42:28
2026-04-25 22:40:49
单仁行
单仁行
我们致力于帮助企业转型互联网
2355文章数 664关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

台媒:毛里求斯表态戳破台当局谎言

头条要闻

台媒:毛里求斯表态戳破台当局谎言

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

本地
亲子
旅游
教育
公开课

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

亲子要闻

妈妈曝瑶一瑶有多动症!5岁女儿坐不住爱乱摸,做挑衅表情不礼貌

旅游要闻

珠海梦幻水城今日开园,五一“湿身”派对提前锁定

教育要闻

吴欣歆:整本书阅读的五种基本策略

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版