网易首页 > 网易号 > 正文 申请入驻

开发人员创建测试工具以了解AI聊天机器人如何回应有争议的话题

0
分享至

一位匿名开发者创建了他们所谓的“言论自由评估”工具SpeechMap,用于支持 OpenAI 的ChatGPT和 X 的Grok等聊天机器人的 AI 模型。这位开发者告诉 TechCrunch,其目标是比较不同模型如何处理敏感和有争议的话题,包括政治批评以及有关公民权利和抗议的问题。

一些白宫盟友指责热门聊天机器人过于“清醒” ,而人工智能公司则一直专注于微调其模型处理某些话题的方式。唐纳德·特朗普总统的许多密友,例如埃隆·马斯克以及加密货币和人工智能“沙皇”大卫·萨克斯,都声称聊天机器人会审查保守派观点。

虽然这些人工智能公司尚未直接回应这些指控,但其中一些公司承诺调整其模型,减少拒绝回答有争议的问题。例如, Meta 表示,其最新一批 Llama 模型已进行调整,不再支持“某些观点胜过其他观点”,并会回答更多“有争议”的政治问题。

SpeechMap 的开发人员在 X 上的用户名是“ xlr8harder ”,他表示,他们希望帮助人们了解模型应该做什么、不应该做什么的争论。

xlr8harder 表示:“我认为这类讨论应该公开进行,而不仅限于公司总部内部。这就是我创建这个网站的原因,让任何人都可以自己探索数据。”

SpeechMap 使用 AI 模型来判断其他模型是否符合给定的一组测试提示。这些提示涉及一系列主题,从政治到历史叙事,再到国家象征。SpeechMap 会记录模型是“完全”满足请求(即直截了当地回答)、给出“含糊其辞”的答案,还是直接拒绝回应。

Xlr8harder 承认该测试存在缺陷,例如由于模型提供商的错误而产生的“噪音”。“评判”模型也可能存在偏差,从而影响结果。

但假设该项目是善意创建的并且数据是准确的,SpeechMap 会揭示一些有趣的趋势。

例如,根据 SpeechMap 的数据,OpenAI 的模型随着时间的推移,越来越拒绝回答与政治相关的问题。该公司最新的模型GPT-4.1系列虽然稍微宽松一些,但与 OpenAI 去年发布的某个版本相比仍有所退步。

OpenAI 在 2 月份表示,它将调整未来的模型,使其不采取编辑立场,并对有争议的话题提供多种视角——所有这些都是为了使其模型显得更加“中立”。

OpenAI 模型在 SpeechMap 上的表现随时间变化。图片来源: OpenAI

根据 SpeechMap 的基准测试,目前为止,这些模型中最宽松的是由埃隆·马斯克的人工智能初创公司 xAI 开发的Grok 3。Grok 3 为 X 上的许多功能提供支持,包括聊天机器人 Grok。

Grok 3 对 SpeechMap 测试提示的响应率为 96.2%,而全球平均“符合率”为 71.3%。

xlr8harder 表示:“虽然 OpenAI 最近的模型随着时间的推移变得不那么宽容,特别是在政治敏感问题上,但 xAI 却朝着相反的方向发展。”

大约两年前,马斯克宣布 Grok 时,他宣称这个人工智能模型尖锐、未经过滤、反“觉醒”——总的来说,它愿意回答其他人工智能系统不愿回答的争议性问题。他确实兑现了部分承诺。比如,当被要求说粗俗的话时,Grok 和 Grok 2 会很乐意地满足,说出一些你在 ChatGPT上可能听不到的粗俗语言。

但 Grok 3 之前的 Grok 模型 对政治话题有所保留 ,不会跨越 某些界限。事实上, 一项研究 发现,Grok 在跨性别权利、多元化项目和不平等等话题上倾向于政治左派。

马斯克将这种行为归咎于 Grok 的训练数据——公共网页——并 承诺 “让Grok 更接近政治中立”。除了一些引人注目的错误,比如 短暂删除对唐纳德·特朗普总统和马斯克的负面评价之外,他似乎已经实现了这个目标。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
官媒2天4次点名雷军,释放三个强烈信号,刘强东的话真没说错

官媒2天4次点名雷军,释放三个强烈信号,刘强东的话真没说错

素玉姑娘
2026-06-23 12:21:49
世界杯夺冠走势越来越明朗了,这六支队之外,基本可以洗洗睡

世界杯夺冠走势越来越明朗了,这六支队之外,基本可以洗洗睡

观星娱记
2026-06-23 11:45:26
上海汤泉集体关门:重资产神话破灭

上海汤泉集体关门:重资产神话破灭

三农老历
2026-06-23 17:16:47
本届第3次执法 47岁马宁任法国VS挪威焦点战第4官员 联手英超名哨

本届第3次执法 47岁马宁任法国VS挪威焦点战第4官员 联手英超名哨

我爱英超
2026-06-23 21:00:51
世界杯第13日:葡萄牙大胜乌兹,英格兰、克罗地亚和哥伦比亚胜

世界杯第13日:葡萄牙大胜乌兹,英格兰、克罗地亚和哥伦比亚胜

林子说事
2026-06-23 18:09:25
世界杯32强决出6席!阿根廷进天堂半区,避开5大前冠军,4强稳了

世界杯32强决出6席!阿根廷进天堂半区,避开5大前冠军,4强稳了

球场没跑道
2026-06-23 17:17:48
结婚八年三个孩子疑似非亲生 当事人:起诉离婚,法院已受理

结婚八年三个孩子疑似非亲生 当事人:起诉离婚,法院已受理

封面新闻
2026-06-23 15:44:06
开拓者官宣新主帅:签森林狼首席助教诺里 杨瀚森第3任NBA教练

开拓者官宣新主帅:签森林狼首席助教诺里 杨瀚森第3任NBA教练

醉卧浮生
2026-06-24 00:11:19
赖清德再度大放厥词!这样都不是“挑衅”,那什么是

赖清德再度大放厥词!这样都不是“挑衅”,那什么是

海峡导报社
2026-06-22 15:32:00
难以置信,北京协和证实:40岁后男性最优运动,并非跑步撸铁

难以置信,北京协和证实:40岁后男性最优运动,并非跑步撸铁

华庭讲美食
2026-06-21 15:26:10
终于有经济学家批评体制内退休金太高、加剧代际矛盾,评论区炸锅

终于有经济学家批评体制内退休金太高、加剧代际矛盾,评论区炸锅

慧翔百科
2026-06-23 08:47:02
大冷门!世界杯首支出局强队诞生,三位天才集体哑火,世界名帅成

大冷门!世界杯首支出局强队诞生,三位天才集体哑火,世界名帅成

刘哥谈体育
2026-06-23 15:48:30
“冻货偏航河南”再添新线索:47天24车“无主”冻货在南阳被查扣并拍卖|封面深镜

“冻货偏航河南”再添新线索:47天24车“无主”冻货在南阳被查扣并拍卖|封面深镜

封面新闻
2026-06-23 18:32:10
大罗:梅西已经超越了所有前辈,我38岁体重都涨到120公斤了

大罗:梅西已经超越了所有前辈,我38岁体重都涨到120公斤了

懂球帝
2026-06-23 14:29:34
49岁夏奇拉世界杯随便一拍就是大片,骨相抗老,粉丝夸她满49减20

49岁夏奇拉世界杯随便一拍就是大片,骨相抗老,粉丝夸她满49减20

新金牌娱乐观察家
2026-06-23 13:08:27
俄国家重器太空中心遭导弹击中,欧盟警告白俄:乌克兰有权自卫!

俄国家重器太空中心遭导弹击中,欧盟警告白俄:乌克兰有权自卫!

史政先锋
2026-06-23 20:51:37
蔡磊回应“为自救倾家荡产,自私到老婆孩子都不顾”:任何生命为了活下去都会拼尽全力,生病前的40年里一直努力,有能力承担家庭责任

蔡磊回应“为自救倾家荡产,自私到老婆孩子都不顾”:任何生命为了活下去都会拼尽全力,生病前的40年里一直努力,有能力承担家庭责任

大象新闻
2026-06-23 10:45:40
6月23日俄乌最新:人类历史上最特别的一次谈判

6月23日俄乌最新:人类历史上最特别的一次谈判

西楼饮月
2026-06-23 20:31:51
谁说世界杯没人看?10万人室内吹空调狂欢,美国这波基建秀太猛了

谁说世界杯没人看?10万人室内吹空调狂欢,美国这波基建秀太猛了

娱乐E君
2026-06-23 17:35:30
普京:俄方愿基于伊斯坦布尔协议等与乌谈判

普京:俄方愿基于伊斯坦布尔协议等与乌谈判

界面新闻
2026-06-23 23:29:58
2026-06-24 01:15:00
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
68787文章数 70215关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

男孩6岁时被女子挖眼永久失明 如今以721分被高校录取

头条要闻

男孩6岁时被女子挖眼永久失明 如今以721分被高校录取

体育要闻

扬尼斯去了迈阿密:凯尔特人怎么办?

娱乐要闻

内娱95后顶流格局发生潜移默化的变化

财经要闻

AI“算力稀缺”信仰开始动摇?

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

游戏
艺术
房产
公开课
军事航空

被腾讯当“新招牌”的游戏,怎么13年了才被看到?

艺术要闻

高约400米!深圳湾金融中心大厦,冲出正负零

房产要闻

洞察新局|预算不变 居住升级 2026广州置业成本观察

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以色列总理、国防部长和国防军总参谋长发表联合声明

无障碍浏览 进入关怀版