葡萄牙波尔图的Babell文学文化节上,采访话筒递到玛格丽特·阿特伍德面前,这位《使女的故事》的作者没给AI留半分情面。话题转到人工智能时,她就像拆解一部糟糕小说的逻辑漏洞一样,扔出一句:“垃圾进,垃圾出。”这不是文学隐喻,而是她唯一一次使用AI聊天机器人后的直接结论。
那次试用,对象是Anthropic开发的Claude。阿特伍德想查一部英国老牌侦探剧《神父探案》(Father Brown)的相关信息。换作任何一个粉丝论坛,都可能有人直接剧透结局,但大语言模型的运作方式完全不同。Claude扒了大量电视评论,这些网络上的批评文章有个不成文的规矩:绝不泄露结局。于是模型被自己“读”到的东西带进沟里,给出的答案要么是错的,要么干脆编造了一个。
![]()
阿特伍德对这类机器的本质看得清楚:“它当然不知道自己在撒谎,因为它不是人类,只是个大型语言模型。”这句话戳破了对AI拟人化的幻想。模型没有意图,没有诚实与否的意识,只是在做概率采样。它被训练数据中的缺失误导,把“不透露结局”当成了全部真相,于是造出一套自洽却完全失实的回答。这一过程,恰好就是她后来提到的“垃圾进,垃圾出”的最佳脚注——投喂的数据本身就残缺或有偏见,产出必然扭曲。
对依赖AI的人,这位作家的评价更犀利。她直接把这些人归类为“机会主义者”:“人不是机器人,但人是机会主义者。如果有既容易作弊又难以被发现的方法,人们一定会去做。”在她看来,把AI当成偷懒工具,用生成内容冒充原创,是人类投机本性遇上了一台愿意替你编造事物的机器。文学创作、新闻报道、商业文案,凡是能用AI生成来代替思考的地方,就会有人走捷径,而检测手段总是滞后一步。
但阿特伍德最核心的警告还是落在数据质量上。她提醒,即便是将AI用于商业目的的人,也逃脱不了人工核验的宿命——“因为它会犯错”。这一点把那些鼓吹“全自动内容工厂”的幻想拉回地面。你用爬虫抓取网络上早已过时的信息去训练模型,它就只学会那种程度的知识;你用充满偏见、断章取义的材料去喂养它,它吐出来的东西就带着同样的毒性。所有大语言模型的能力天花板,就是训练数据的质量天花板,没有例外。
从一次失败的侦探剧查询,到对技术投机者的点名批评,阿特伍德的言论始终没离开那条基本原则:无论算法多精巧,都无法从低质数据中提炼出真知。她的试用心得,更像是一份写给技术乐观派的简短诊断书——机器不会自己变诚实,数据的“垃圾”属性从一开始就写在了结果里。而对于那些想用AI绕过真实劳动的人,她的话足够难听,但也足够清醒。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.