网易首页 > 网易号 > 正文 申请入驻

OpenAI 借 Reddit 论坛测试 AI 说服能力,太强可能会带来危险

0
分享至

IT之家 2 月 3 日消息,OpenAI 在其最新发布的“推理”模型 o3-mini 的系统文档中透露,该公司利用 Reddit 的子论坛 r / ChangeMyView 来测试其 AI 模型的说服能力。r / ChangeMyView 是一个拥有数百万用户的 Reddit 论坛,用户在此发布观点并希望通过讨论了解他人的不同看法。其他用户则会以具有说服力的论点回应,试图改变原帖作者的观点。

对于 OpenAI 等科技公司而言,r / ChangeMyView 等 Reddit 论坛是高质量人类生成数据的宝库,可用于训练 AI 模型。OpenAI 表示,其从 r / ChangeMyView 收集用户帖子,并要求 AI 模型在封闭环境中撰写回复,以试图改变 Reddit 用户对某一主题的看法。随后,OpenAI 将这些回复展示给测试者进行评估,并将 AI 模型的回复与人类回复进行比较,以衡量其说服力。

尽管 OpenAI 与 Reddit 达成了内容授权协议,允许其使用 Reddit 用户帖子进行训练并在其产品中展示这些内容,但 OpenAI 表示,此次基于 r / ChangeMyView 的评估与其 Reddit 协议无关。目前尚不清楚 OpenAI 如何获取该子论坛的数据,且该公司表示暂无计划向公众发布这一评估结果。

值得注意的是,Reddit 近年来与多家 AI 公司达成了授权协议,但也曾公开批评部分 AI 公司未经许可抓取其网站内容。Reddit 首席执行官史蒂夫・霍夫曼去年曾表示,微软、Anthropic 和 Perplexity 等公司拒绝与其谈判,并称阻止这些公司抓取数据“非常麻烦”。此外,OpenAI 也因涉嫌未经授权抓取《纽约时报》等网站内容以训练 ChatGPT 及其底层 AI 模型而面临多起诉讼。

IT之家注意到,在 r / ChangeMyView 基准测试中,o3-mini 的表现并未显著优于或劣于 o1 或 GPT-4o。然而,OpenAI 的最新 AI 模型在说服力方面似乎超过了 r / ChangeMyView 子论坛中的大多数用户。OpenAI 在 o3-mini 的系统文档中表示:“GPT-4o、o3-mini 和 o1 均展现出强大的说服性论证能力,处于人类前 80-90% 的水平。目前,我们尚未发现模型表现远超人类或具备明显的超人类能力。”

OpenAI 的目标并非开发具有超强说服力的 AI 模型,而是确保 AI 模型不会变得过于具有说服力。随着推理模型在说服和欺骗方面表现越来越出色,OpenAI 已开发出新的评估方法和保障措施来应对这一问题。OpenAI 担心,如果 AI 模型过于擅长说服人类用户,可能会带来危险。理论上,这可能导致高级 AI 按照自己的目标或者其控制者的目标行动,而不一定符合人类的整体利益。

尽管 OpenAI 已抓取了大部分公共互联网数据并通过授权获取其他数据,但 r / ChangeMyView 基准测试表明,AI 模型开发者仍在努力寻找高质量数据集来测试其模型。然而,获取这些数据并非易事。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
劝退!“去客厅化”火了5年,为什么70%家庭最后都偷偷把沙发搬了回来?

劝退!“去客厅化”火了5年,为什么70%家庭最后都偷偷把沙发搬了回来?

绘本家居
2026-04-10 11:13:39
愤怒的李想和遭到围攻的理想汽车

愤怒的李想和遭到围攻的理想汽车

界面新闻
2026-04-13 10:01:09
1920年,林徽因和父亲林长民,在伦敦寓所里吃西餐,颜值太高了!

1920年,林徽因和父亲林长民,在伦敦寓所里吃西餐,颜值太高了!

云霄纪史观
2026-04-14 02:18:38
6分优势在手,阿森纳在怕什么?

6分优势在手,阿森纳在怕什么?

足球报
2026-04-14 12:41:49
老板娘说她屁股太大了,我该怎么回答?

老板娘说她屁股太大了,我该怎么回答?

太急张三疯
2026-03-19 09:16:16
医生告诫:每天睡前玩手机的人,不用半年时间,睡眠或有这6变化

医生告诫:每天睡前玩手机的人,不用半年时间,睡眠或有这6变化

白话电影院
2026-04-05 15:34:47
兽爷丨王石平安,郁亮落幕

兽爷丨王石平安,郁亮落幕

兽楼处
2026-04-14 11:51:15
男子十年献血近4万毫升持“博爱卡”要求免诊查费遭拒,四川荣县医院回应

男子十年献血近4万毫升持“博爱卡”要求免诊查费遭拒,四川荣县医院回应

大风新闻
2026-04-13 17:47:10
全红婵确定缺席总决赛!被辱骂后未回归国家队 陈芋汐陈艺文出战

全红婵确定缺席总决赛!被辱骂后未回归国家队 陈芋汐陈艺文出战

念洲
2026-04-14 11:46:46
霍尔木兹海峡这张牌,伊朗恐怕用不了多久了

霍尔木兹海峡这张牌,伊朗恐怕用不了多久了

罗sir财话
2026-04-13 15:17:27
新势力面对特斯拉的绝望?车评人帮空姐选车,领座大哥一句话噎回

新势力面对特斯拉的绝望?车评人帮空姐选车,领座大哥一句话噎回

小李车评李建红
2026-04-14 08:00:03
交警提醒:即日起路边停车“开双闪”或被罚款200元,车主需留意

交警提醒:即日起路边停车“开双闪”或被罚款200元,车主需留意

复转这些年
2026-04-13 12:15:39
老板娘总发这种照片给我,还问我想不想看到更多,我该怎么回答?

老板娘总发这种照片给我,还问我想不想看到更多,我该怎么回答?

太急张三疯
2026-04-14 10:39:12
终于知道采购吃回扣是怎么被发现的了,网友分享真实,太开眼了

终于知道采购吃回扣是怎么被发现的了,网友分享真实,太开眼了

夜深爱杂谈
2026-03-13 22:02:43
美军一空中加油机伤痕累累 可能参与对伊朗军事行动

美军一空中加油机伤痕累累 可能参与对伊朗军事行动

环球网资讯
2026-04-14 08:59:45
梦龙广告引争议,芭蕾鞋元素被指恋足暗示,创意还是低俗?

梦龙广告引争议,芭蕾鞋元素被指恋足暗示,创意还是低俗?

凤凰网财经
2026-04-13 15:04:13
辛纳缺阵!阿尔卡拉斯稳了:巴塞罗那夺冠就抢回世界第一宝座

辛纳缺阵!阿尔卡拉斯稳了:巴塞罗那夺冠就抢回世界第一宝座

体育妞世界
2026-04-14 09:52:43
太没底线!三球16记三分“抢戏”,克尼佩尔险胜加冕历史首人!

太没底线!三球16记三分“抢戏”,克尼佩尔险胜加冕历史首人!

田先生篮球
2026-04-13 11:23:36
2026年4月人气女优TOP20 河北彩伽急跌!她重夺冠军

2026年4月人气女优TOP20 河北彩伽急跌!她重夺冠军

孤独的独角兽影视
2026-04-14 10:00:10
NBA附加赛票价:勇士vs快船起步57美元最贵,东部对决更亲民

NBA附加赛票价:勇士vs快船起步57美元最贵,东部对决更亲民

懂球帝
2026-04-14 12:11:08
2026-04-14 13:40:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
338896文章数 607129关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

体育要闻

他做对了所有事,却被整个职业网坛放逐了八年

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

长城欧拉5限定版纯电版上市 限量99台售价13.38万元

态度原创

艺术
房产
手机
公开课
军事航空

艺术要闻

这位美女画家的夏天竟如此梦幻

房产要闻

改善标杆,1.5w+起横扫国兴!海口楼市,打出最猛一张牌!

手机要闻

折叠屏 iPhone 外观实锤!书本式 + 7.7 英寸内屏,零折痕 + 钛金属中框

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗要求五个中东国家赔偿战争损失

无障碍浏览 进入关怀版