![]()
就算特意标注 “右手拿苹果、左手写字”,AI 也会倔强地颠倒过来,甚至出现手指扭曲的 “鬼畜画面”。这不是 AI 逻辑不行,是我们给它的 “童年教育” 出了问题 , 训练数据集的偏见,让左手成了 AI 认知里的 “盲区”。
![]()
不止是左手写字,只要涉及左右方位的精准要求,AI 几乎都会 “掉链子”。
我尝试让模型画 “左手举魔法棒”“左手拎鸡右手拎高达”,结果要么左右颠倒,要么直接忽略左手的指令,全程用右手完成动作。
![]()
测试中,有模型把左手画成了右手的镜像,还有的直接将剪刀放在右手上,完全无视 “左撇子” 的关键词。
更有意思的是,当要求生成 “双手戴不同颜色手套” 时,AI 能精准画出不同颜色,但依然会把原本指定给左手的颜色换到右手上。
这种稳定的翻车,不是模型算力不够,而是它从训练数据里学到的 “常识” 就是:大部分动作都该由右手完成。
![]()
研究指出,问题的关键是数据集的 “完整度” 和 “平衡性” 不足。
完整度指的是每种场景的不同组合是否都有样本,比如 “圆在上、三角在下” 和 “三角在上、圆在下” 都该出现;平衡性则是指不同组合的样本比例是否均匀。如果数据里 90% 都是 “右手写字”,AI 就会默认 “写字 = 右手”。
![]()
11 月 28 日《人民日报》提到,某 AI 公司的数据集分析显示,涉及手部动作的样本中,右手占比高达 89%,左手相关样本仅占 7%,还有 4% 是双手无明确左右区分的场景。
类似的偏见还出现在职业形象生成中,让 AI 画 “工程师”“程序员”,男性形象占比超 80%,这也是因为训练数据里相关职业的男性样本远多于女性,导致 AI 形成了刻板印象。
![]()
意识到问题后,不少企业和科研机构开始着手优化数据集。
团队负责人表示,新增样本重点提升了数据的完整度和平衡性,比如右手写字和左手写字的样本比例调整为 6:4,职业形象中女性、少数群体的占比也得到补充。
![]()
浙江大学人工智能研究所也在开展相关研究,他们联合美术院校学生,专门绘制了 10 万套 “左右方位精准标注” 的图像素材,涵盖日常动作、职业场景等,目前已接入部分开源模型进行测试。
测试结果显示,补充多元样本后,AI 生成左手相关场景的正确率提升至 68%,虽然还没达到完美,但已经有了明显改善。这说明 AI 的偏见并非不可逆转,只要给它看到更完整的世界,它就能学会更全面的认知。
![]()
AI 的偏见,本质上是人类认知和数据采集的缩影。给 AI 补全多元样本的过程,也是我们正视世界多样性的过程。
随着数据集不断优化,相信 AI 终将分清左右,而我们也该借此提醒自己:跳出固有认知,才能看到更完整的世界。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.