网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

"《别让 AI 忽悠你！苹果新技术 RL4HS 揪出每处 “幻觉”》"

2025-10-08 19:15:40　来源: 普览

河南举报

0

分享至

苹果最近在AI研究上跟开了挂似的，刚出的RL4HS框架直接解决了个大麻烦。

以前大语言模型生成内容有“幻觉”，就是说瞎话，咱们顶多知道它错了，却找不着具体哪句错。

现在这个框架不一样，能精准把错误片段标出来，连GPT-5和o3都没它做得好。

这对咱们平时用AI写东西、查资料的人来说，真是省了不少功夫，毕竟谁也不想拿着AI给的错信息瞎忙活。

RL4HS咋做到的？靠两个“神器”破局
本来想觉得AI判断对错就是简单分个“有幻觉”“没幻觉”，后来发现根本不够用。

苹果团队先拿Qwen系列模型做实验，试了两种模式：一种让模型先推理再判断，一种直接判断。

结果挺有意思，要是只让模型判断一次，先推理的优势不明显，但多试几次，比如试5次，先推理的模型总能出一个对的答案。

这就跟咱们做题似的，多检查几遍，更容易发现哪里错了，有了这个发现，团队才搞出RL4HS框架，核心靠两个“神器”。

第一个是“片段级奖励”，不是像以前那样给整体打分，而是盯着每个片段给奖励。

比如AI标对一个错误片段，就给正向反馈，标错了或者漏了，就扣反馈。

这样一来，模型就有动力去精准找错，而不是随便给个“有幻觉”的结论糊弄事。
第二个是“CAPO策略”，这是为了治模型的“懒病”。

一开始用的GRPO方法有个问题，模型总爱说“没错误”，因为这样容易拿高分，毕竟不用费劲找错。

苹果就加了个CAPO，给“没错误”的奖励打了折，实验里是按一半算的。

这么一来，模型不敢随便偷懒了，也愿意花功夫找真正的错误片段。
RL4HS落地真有用？这些场景直接受益
光说技术厉害不够，得看这东西实际用起来咋样，毕竟咱们关心的是它能不能帮上忙。

在内容审核这块，苹果自己已经先用上了，比如AppleNews的摘要生成。

以前编辑改稿子，得逐句查有没有AI编的瞎话，费时间还容易漏。

现在RL4HS直接把错误片段标出来，编辑顺着标红的地方改就行。

编辑们怕是最有体会，以前改一篇长摘要得半天，现在效率提了不少，错误率也降了很多。

医疗和法律这些严肃领域，RL4HS的作用更关键，AI要是给错诊疗建议，比如瞎说“某药所有糖尿病患者都能用”，这可不是小事。

RL4HS能把这句话标出来，还提醒得结合患者肾功能判断，等于给医生加了道保险。

法律文书也一样，合同里要是有“乙方30天内交付，甲方又能随便延长”这种矛盾话，它也能揪出来，避免后续纠纷。
苹果还干了件实在事，把RL4HS框架开源了，还联合信通院这些机构做行业规范。

以前各家检测AI幻觉的方法不一样，标准也乱，现在有了统一方向，以后不管是大公司还是小团队用这个技术，都有章可循。

如此看来，这技术不光解决了眼前的问题，还为以后AI可信度发展铺了路，当然，RL4HS也不是完美的。

跟今年其他技术比，比如CHiP、小红书的语义图方法，它在纯文本上表现更好，但想扩展到图片、这些多模态内容就难了。

试了加视觉模块，虽然准确率提上去了，可反应变慢了，平均得等两秒多才能出结果。

另外，隐私保护也得盯紧，要是AI瞎编用户隐私，比如瞎说“某人有盗窃记录”，RL4HS会自动挡住输出还记日志，这一点做得挺周到，毕竟隐私可不是小事。
总的来说，苹果这个RL4HS框架算是给AI可信度帮了大忙。

以前AI瞎话难找，咱们用着心里没底，现在能精准定位错误，不管是写东西、看新闻，还是医疗、法律这些领域，用AI都能更放心。

毫无疑问，AI技术发展快是好事，但能让人信得过才是真本事，RL4HS算是走对了方向。

以后要是这技术再完善完善，能处理多模态内容，反应再快点，说不定AI“说瞎话”的问题就能彻底解决了。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

视觉压缩称王？谷歌死守AI黑科技，DeepSeek一夜开源

新智元 2025-11-14 22:10:46
6 跟贴 6
拿下奥数银牌的Google AlphaProof，首次公开技术细节

DeepTech深科技 2025-11-13 21:43:37
0 跟贴 0

PixelRefer ：让AI从“看大图”走向“看懂每个对象”

机器之心Pro 2025-11-11 12:49:23
0 跟贴 0

Jeff Dean盛赞姚班校友AI新研究，目前人已到Meta

量子位 2025-11-15 13:12:03
2 跟贴 2
SFT远不如RL？永不过时的剃刀原则打开终身学习大模型训练的大门

机器之心Pro 2025-09-09 20:19:13
0 跟贴 0

长视频AI数字人来了！字节×浙大(1)

机器之心Pro 2025-09-04 17:27:37
0 跟贴 0

OpenAI开始变得俗气了

虎嗅APP 2025-11-15 23:59:07
0 跟贴 0
在全球最大的科技峰会现场，他们用DeepSeek养出迷你“独角兽”

虎嗅APP 2025-11-16 01:41:05
0 跟贴 0

何小鹏和雷军真正的塑料兄弟

雷科技 2025-06-06 21:23:05
59 跟贴 59
上海老板线上下单6台苹果手机，骑手取货后连人带货消失了，平台：已垫付相关款项

三湘都市报 2025-11-15 13:26:16
86 跟贴 86
浙江多人应聘遭引导高价购买苹果手机，公司被指赚取差价获利

温州草根 2025-11-15 22:09:10
1 跟贴 1
男子戴了苹果新出的iphone pocket，却被认成是围巾

重庆头条官方 2025-11-14 21:08:34
0 跟贴 0
苹果被高压电击中后会发生什么反应

秋天荒野 2025-11-15 10:25:33
1 跟贴 1
苹果联名三宅一生出 “袜子包”，1899 元定价引群嘲，开售遭溢价

诺诺谈史 2025-11-15 14:55:06
0 跟贴 0
AirPods耳机盒DIY打磨抛光，苹果耳机清洁

果粉之家 2025-11-11 23:18:17
0 跟贴 0
段永平谈苹果为何放弃造车：汽车给用户提供不了足够的价值

极果酷玩 2025-11-16 02:04:58
0 跟贴 0
黄仁勋：中国的AI市场无论有没有英伟达都会进步与华为是竞争对手不是敌人

财联社 2025-07-21 10:22:14
7 跟贴 7
苹果三宅联名手机包半小时售罄，二手市场溢价500元

三人成虎V5 2025-11-15 12:24:25
3 跟贴 3
淄博卖苹果的大哥火了！成袋的苹果被摆得整整齐齐，网友猜他是J人，本人诚实回应: 什么是J人，咱也不知

封面新闻 2025-11-14 18:56:16
1 跟贴 1
老外苹果手机坏了要维修，结果没想到，被“天价”维修费给吓跑了

姜江爱搞笑 2025-11-15 15:50:37
2 跟贴 2
在星巴克和瑞幸店里“枯坐”一整天，我们发现了咖啡的资本密码

饭统戴老板 2025-09-10 19:37:27
35 跟贴 35
《熊磊卖陕西苹果口误翻车，与杜新枝互动太吸睛！》

秦总说娱乐 2025-11-14 08:57:36
12 跟贴 12
就是个模型，有啥大惊小怪的

沙雕动画 2025-11-15 15:50:41
0 跟贴 0
孩子碰自己隐私，宝妈如何区分是否遭受过侵犯伤害呢？

孩子们的安全官爸爸 2025-11-12 20:51:00
0 跟贴 0
山东淄博，大哥路边卖苹果，大小均匀没有坏果

南昌晚报 2025-11-13 17:43:29
0 跟贴 0
iPhone18 Pro工艺大升级，色差问题彻底解决？

极果酷玩 2025-11-14 00:43:07
0 跟贴 0
苹果iPhoneAir国行版当前仅支持中国联通eSIM服务！那什么是eSIM？

每日经济新闻 2025-09-10 18:35:23
0 跟贴 0
未来的 iPhone，想靠卫星消灭「无服务」

爱范儿 2025-11-15 19:14:11
10 跟贴 10
腾讯回应与苹果小程序游戏支付协议进度：对此持建设性态度

每日经济新闻 2025-11-13 23:24:45
0 跟贴 0
清华团队：1.5B 模型新基线！用「最笨」的 RL 配方达到顶尖性能

机器之心Pro 2025-11-13 14:56:23
1 跟贴 1
苹果17Pro Max黑屏4天！客服称硬件故障，退换货建议曝光！

钮婉仪 2025-11-14 04:22:14
1 跟贴 1
这位卖苹果的大哥，还没有意识到，事情的严重性！

火火小红帽 2025-11-15 19:08:03
0 跟贴 0
液态玻璃更新，苹果推送 iOS 26.2 Beta 2

爱范儿 2025-11-14 03:20:42
0 跟贴 0
网友用苹果4给苹果17传输数据，跨越了十几年等待，网友：内存还没人家型号大

星沙时报 2025-11-13 07:00:00
0 跟贴 0
骑手送价值8万苹果手机，结果人货失踪

你是我的一个梦 2025-11-14 20:07:27
0 跟贴 0
关注 | 三大航司：日本机票免费退改！

天津广播 2025-11-15 15:29:10
58153 跟贴 58153
雷军偷家苹果库克气哭

雷科技 2025-07-04 14:14:12
1 跟贴 1
比亚迪王传福：做大产业，做出中国制造业应有的位置

每日经济新闻 2025-07-22 17:51:59
0 跟贴 0
玉渊谭天：中方已做好对日实质反制准备

新京报 2025-11-15 17:58:37
23737 跟贴 23737
NeurIPS Spotlight｜GHAP：3DGS“剪枝”变成“重建高斯世界”

机器之心Pro 2025-11-14 19:05:05
0 跟贴 0

郑丽文接受日媒专访倡导“一中保台”，反对大幅增加军费

郑丽文接受日媒专访倡导“一中保台”，反对大幅增加军费

海峡导报社

2025-11-15 08:03:07

狂妄至极！日本大使：从未接受过“一个中国”政策，不需要撤回

狂妄至极！日本大使：从未接受过“一个中国”政策，不需要撤回

梁讯

2025-11-15 14:35:07

河南一商人称遭民警逼迫签下千万元调解协议后又被抓，最新进展：获国赔近18万元，法院再判返其1200万元

河南一商人称遭民警逼迫签下千万元调解协议后又被抓，最新进展：获国赔近18万元，法院再判返其1200万元

大风新闻

2025-11-15 17:55:03

山西摔狗反杀案，律师一句话问懵法官：天黑后你敢去案发现场吗？

山西摔狗反杀案，律师一句话问懵法官：天黑后你敢去案发现场吗？

慢半拍sir

2025-11-15 15:15:14

杭州母亲偷看00后女儿手机大吃一惊：月薪九千元的女儿每月花五千元购买秒回师服务

杭州母亲偷看00后女儿手机大吃一惊：月薪九千元的女儿每月花五千元购买秒回师服务

观威海

2025-11-15 15:06:06

上海的通报来了，但荒诞并非只发生在上海

上海的通报来了，但荒诞并非只发生在上海

清书先生

2025-11-14 17:07:14

严查非机动车非法改装违法行为！

严查非机动车非法改装违法行为！

上海交警

2025-11-13 16:19:09

防止规模性返乡滞乡，寒意传到每个人了

防止规模性返乡滞乡，寒意传到每个人了

家传编辑部

2025-11-16 00:19:44

全运会乒乓球：首个11:0诞生！王曼昱拒绝让球，樊振东3:1大逆转

全运会乒乓球：首个11:0诞生！王曼昱拒绝让球，樊振东3:1大逆转

国乒二三事

2025-11-15 07:51:35

日本媒体慌了：中国发布避免前往日本的提醒，旅游业可能受影响

日本媒体慌了：中国发布避免前往日本的提醒，旅游业可能受影响

沧海旅行家

2025-11-15 14:27:37

高市一刻也等不了了！一架专机飞抵中国，这次派的高官，很有讲究

高市一刻也等不了了！一架专机飞抵中国，这次派的高官，很有讲究

寻墨阁

2025-11-12 21:14:07

金鸡奖六大不公平：易烊千玺没资格拿影帝，祖峰颁奖前被除名

金鸡奖六大不公平：易烊千玺没资格拿影帝，祖峰颁奖前被除名

光影新天地

2025-11-15 22:28:37

不准踏入中国市场一步？我国下达“逐客令”，三星彻底炸锅：恳请放过

不准踏入中国市场一步？我国下达“逐客令”，三星彻底炸锅：恳请放过

白梦日记

2025-11-15 20:11:28

又是4-0！王曼昱连续两届全运会横扫陈梦卫冕冠军还差1胜连冠

又是4-0！王曼昱连续两届全运会横扫陈梦卫冕冠军还差1胜连冠

颜小白的篮球梦

2025-11-15 21:18:00

日本机票大涨，三大航司免费退改签！这是航空公司与国人间的默契

日本机票大涨，三大航司免费退改签！这是航空公司与国人间的默契

垛垛糖

2025-11-15 22:16:27

人口数据崩塌，东北老铁遥遥领先

人口数据崩塌，东北老铁遥遥领先

望岳

2025-11-12 22:26:49

韩媒：输给中国U22是前所未有的耻辱，这是一场令人震惊的比赛

韩媒：输给中国U22是前所未有的耻辱，这是一场令人震惊的比赛

懂球帝

2025-11-15 22:12:06

男保姆照顾瘫痪女子,3个月竟被他侵犯数十次,男保姆:是她自愿的

男保姆照顾瘫痪女子,3个月竟被他侵犯数十次,男保姆:是她自愿的

罪案洞察者

2025-11-13 14:30:05

楼继伟称房地产将持续低迷，需提高财政赤字支持房地产转型

楼继伟称房地产将持续低迷，需提高财政赤字支持房地产转型

风向观察

2025-11-15 14:32:21

正部级蔡名照、叶冬松、黄明、宋秀岩、冯正霖、许又声、苗圩、傅自应、欧阳坚、黄建盛，有新任务

正部级蔡名照、叶冬松、黄明、宋秀岩、冯正霖、许又声、苗圩、傅自应、欧阳坚、黄建盛，有新任务

新京报政事儿

2025-11-15 20:41:56

探寻历史文化, 不仅是了解过去, 更是启迪未来

2904文章数 232关注度

往期回顾全部

科技要闻

撕掉流量外衣，小米还剩什么？

头条要闻

大量日本民众围堵首相官邸大喊：高市早苗下台

头条要闻

大量日本民众围堵首相官邸大喊：高市早苗下台

体育要闻

樊振东和他的尖子班勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级！被骗婚？

财经要闻

小米之“惑”

汽车要闻

"冰彩沙"全配齐红旗HS6 PHEV预售17.88万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

数码

教育

手机

公开课

艺术要闻

她的笔下女子如此动人，晚年却名声扫地！

数码要闻

华为Mate 80全系支持3D人脸识别，同期还有高端“二合一平板电脑”

教育要闻

天塌了啊：英国大学又开始搞大裁员了！

手机要闻

iPhone Air开启eSIM时代：国内厂商纷纷跟进

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版