网易首页 > 网易号 > 正文 申请入驻

AI的“随机性”挑战:它们比人类更“不随机”?

0
分享至

你有没有想过,人类真的能做出完全随机的选择吗?答案可能出乎你的意料。事实上,人类天生就不擅长“随机”,我们总能在看似无序的事物中发现规律,甚至在本该随机的场景中创造出模式。这种“伪随机”行为,其实是一种独特的人类特质。

最近,来自康奈尔大学探讨了大语言模型(LLMs)在随机性方面的表现。他们通过一个经典的实验——生成二进制随机序列,来观察这些模型是否能像人类一样“不随机”,或者是否能真正实现“随机”。

https://arxiv.org/pdf/2406.00092

研究结果令人惊讶。研究者发现,GPT-4和Llama-3在生成随机序列时,不仅表现出人类的偏差,甚至还加剧了这些偏差。

真随机 与 伪随机

人类有一种奇妙的天赋——发现规律。我们总能在生活中找到各种模式:在咖啡的奶泡中看到人脸,在星空里描绘出星座,甚至因为忘记穿幸运衫而觉得勒布朗·詹姆斯投篮不中是自己的错。

然而,这种对规律的敏感也让我们在面对“随机性”时变得格外笨拙。比如,当你让一个人随机选择一个1到10之间的数字时,他们大概率会选择7;或者让他们在脑海中抛硬币,结果多半是正面。这些看似随机的选择,其实背后隐藏着可预测的规律。

抛硬币实验背后的秘密

从20世纪初开始,人类对随机性的研究就从未停止。早在1913年,Fernberger就指出,人类生成随机序列的行为是一个复杂而迷人的课题。此后,无数研究发现,人类生成的随机序列与真正的随机序列有着显著的差异。

我们通过一个经典的行为科学实验来研究这一问题:让人类或机器生成一系列随机结果,比如抛硬币的序列,然后将这些序列与真正的随机序列进行比较。简单来说,就是看看这些序列与“纯粹的随机性”有多大差距。

虚拟硬币实验

▎温度参数:AI的“随机性开关”

与人类不同,大语言模型有一个关键参数——温度(temperature)。温度决定了模型输出的多样性:温度越低,输出越一致;温度越高,输出越随机、越多样化。然而,当温度过高(比如超过1.5)时,模型的输出可能会变得混乱,甚至无法从中解析出硬币的正反面。因此,我们的实验温度范围设定在0到1.5之间。

当我们让AI连续抛20次硬币时,结果同样有趣。实验发现,所有模型在序列的第一次抛硬币中都倾向于选择“正面”,这与人类的行为高度一致。无论温度如何变化,这种“正面优先”的倾向始终存在。这不仅揭示了AI在随机性任务中继承了人类的偏差,还表明这些偏差在某些情况下可能被进一步放大。

▎AI的“第一印象”偏差

在我们的实验中,超过88%的AI生成的硬币序列以“正面”开始,这一比例远远高于人类数据。这表明AI在“第一印象”上继承了人类的偏差,并且表现得更加明显。尤其是Llama-3,它的偏差比GPT系列模型更强。GPT-4和GPT-3.5之间也存在差异,GPT-4通常表现出更少的偏差。

这种“第一印象”偏差不仅出现在硬币的正反面选择中,还出现在其他二元选择中,比如“真/假”或“A/B”。这可能暗示了语言中的“固定二元组”对AI的决策产生了影响。

▎AI的“平衡”偏差

在实验中,GPT-4和Llama-3生成的序列中,正面和反面的比例往往比随机分布更接近50%,甚至比人类生成的序列还要“平衡”。例如,在8次抛硬币的序列中,它们平均会有4次正面,这与人类的行为非常相似。不过,Llama-3在低温时表现出轻微的正面偏好,而GPT-3.5在低温时则表现出强烈的反面偏好,但在高温时会逐渐接近人类的分布。

▎连续序列与N-gram模式

人类在生成随机序列时,往往会过度切换正面和反面,认为这样看起来更“随机”。研究表明,人类序列的交替比例通常为60%,而真正的随机序列应该是50%。在AI实验中,这种“过度切换”的倾向被进一步放大。例如,在8次抛硬币的序列中,理论上应该平均有3.5次交替,但AI模型的交替次数普遍高于这个值。GPT-4在低温时几乎总是生成“正反交替”的序列,而Llama-3则倾向于生成“正反正反……”或“正反正正……”的模式。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到12月25日 ”未来知识库”精选的100部前沿科技趋势报告

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
举报铁路员工站台抽烟沈女士已全网社死!当事人道歉,12306回应

举报铁路员工站台抽烟沈女士已全网社死!当事人道歉,12306回应

原广工业
2026-05-01 00:22:23
越扒越多!孙杨成功把上海体育大学拉下水……

越扒越多!孙杨成功把上海体育大学拉下水……

麦杰逊
2026-04-30 14:51:44
网红“罗二哥”去世,年仅47岁,岳父5天前刚去世,原因令人惋惜

网红“罗二哥”去世,年仅47岁,岳父5天前刚去世,原因令人惋惜

180视角
2026-04-30 13:22:07
发表错误涉华言论 37岁厄齐尔仍不悔改:我才不在乎被处罚 很开心

发表错误涉华言论 37岁厄齐尔仍不悔改:我才不在乎被处罚 很开心

风过乡
2026-04-30 13:08:17
炸了!美伊战火重开,美军航母突然遭袭!

炸了!美伊战火重开,美军航母突然遭袭!

大嘴说天下
2026-04-30 19:07:44
惨败实锤!南海超级碰撞,美日菲仓皇撤退!

惨败实锤!南海超级碰撞,美日菲仓皇撤退!

大嘴说天下
2026-04-30 20:37:31
重拳抓人,600亿光电龙头翁婿先后被带走,这下麻烦大了

重拳抓人,600亿光电龙头翁婿先后被带走,这下麻烦大了

毒sir财经
2026-04-30 17:05:34
堵!堵!堵!苏B大军出动了!

堵!堵!堵!苏B大军出动了!

江南晚报
2026-04-30 18:58:38
“房价比我号码还长”,陆家嘴小学女生晒家,只有插座能攀得起

“房价比我号码还长”,陆家嘴小学女生晒家,只有插座能攀得起

泽泽先生
2026-04-29 21:44:51
一手好牌打个稀烂,直到张军被调查,才明白,林丹的选择有多清醒

一手好牌打个稀烂,直到张军被调查,才明白,林丹的选择有多清醒

林子说事
2026-04-30 18:33:16
名记Shams:杜兰特将继续缺席G6 骨挫伤至少还需再休一周

名记Shams:杜兰特将继续缺席G6 骨挫伤至少还需再休一周

醉卧浮生
2026-04-30 20:56:42
境外势力误导年轻人,烟草电网等单位应该扩岗扩招,破解躺平风气

境外势力误导年轻人,烟草电网等单位应该扩岗扩招,破解躺平风气

今朝牛马
2026-04-30 22:07:20
遭遇异常干旱!朝鲜打响2026粮食保卫战

遭遇异常干旱!朝鲜打响2026粮食保卫战

IN朝鲜
2026-04-30 14:11:57
云南元阳车祸后续:7死12伤太痛心,知情人曝出事发惊人细节

云南元阳车祸后续:7死12伤太痛心,知情人曝出事发惊人细节

奇思妙想草叶君
2026-04-30 22:29:04
太阳队传闻:狄龙·布鲁克斯或将面临1.25亿美元的续约大礼

太阳队传闻:狄龙·布鲁克斯或将面临1.25亿美元的续约大礼

好火子
2026-05-01 04:38:09
央视怒批哪吒破产,百亿国资被霍霍精光

央视怒批哪吒破产,百亿国资被霍霍精光

新浪财经
2026-04-30 10:08:50
全国人民代表大会常务委员会公告〔十四届〕第十七号

全国人民代表大会常务委员会公告〔十四届〕第十七号

新京报
2026-04-30 18:59:10
楼市“最大禁忌”,被打破了!

楼市“最大禁忌”,被打破了!

刘晓博说楼市
2026-04-30 18:08:43
伊朗最高领袖,“最详细伤情”披露

伊朗最高领袖,“最详细伤情”披露

中国新闻周刊
2026-04-30 16:23:05
拥抱人民币果然是个幌子,阿联酋要跟美国一起掀桌子了

拥抱人民币果然是个幌子,阿联酋要跟美国一起掀桌子了

混沌录
2026-04-30 22:01:15
2026-05-01 06:11:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4700文章数 37457关注度
往期回顾 全部

科技要闻

9000亿美元估值,Anthropic即将反超OpenAI

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

孙杨博士学历有问题?官方含糊其辞

财经要闻

易会满被“双开”!

汽车要闻

专访捷途汪如生:捷途双线作战 全球化全面落地

态度原创

旅游
游戏
本地
手机
公开课

旅游要闻

上海旅游业者“踩线团”赴金门交流,金门考察团同日抵厦

《007 初露锋芒》制作成员采访:潜龙腾渊"/> 主站 商城 论坛 自运营 登录 注册 《007 初露锋芒》制作成员采访:潜龙腾渊 神堡薛师傅 2026...

本地新闻

用青花瓷的方式,打开西溪湿地

手机要闻

华硕创X 2026骁龙X2 Elite二合一创作本上架,12999元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版