![]()
韦斯利·哈特维尔向咖啡师举起双拳,在耳边摇晃。然后他放下拳头,伸出大拇指和小指,在胸前上下移动,就像在挤牛奶。最后,他将一只手的手指平放在下巴上,向前弯曲手腕。
听力正常的哈特维尔刚刚使用英国手语(BSL)在位于东伦敦大学的聋人经营的对话咖啡馆订购了一杯加普通牛奶的拿铁,并向聋人咖啡师维克多·奥拉尼扬表示感谢。
"说实话,这家咖啡馆刚在我办公室附近开业时,我一直避开它,因为整个想法让我感到焦虑,"在该大学任教的哈特维尔说。"但现在我被迷住了。手语太神奇了。我正在考虑参加一门课程以学习更多内容。"
让哈特维尔有信心尝试英国手语的是咖啡馆的触摸屏菜单。这些菜单不仅列出了出售的咖啡和蛋糕,还显示了它们的英国手语翻译视频。
对于许多使用英国手语的聋人来说,这种直接访问至关重要。英国手语是英国数万人的第一语言。
在咖啡馆工作了五年的奥拉尼扬现在在雷丁大学攻读会计和管理学位的同时兼职工作,他对听力正常者对视频菜单的反应似乎略感好笑。
"我是由听力正常的人抚养长大的,所以我在听力世界中没有问题,"他用手语表示。"但听力正常者在与我们交流时经常感到焦虑。如果这项技术能帮助他们,那很好,但我自己没问题。"
过去两年,数字和人工智能相关产品激增,旨在弥合聋人和听力世界之间的沟通障碍,从手语虚拟形象到渴望与主流AI平台竞争的大型生成模型。
然而,对许多这些系统的独立评估仍然有限,手语研究人员警告说,当前工具仍难以处理语言细微差别、地区差异和语境,特别是在医疗和法律等高风险环境中。
但这些雄心壮志令人瞩目:英国初创公司Silence Speaks构建了一个基于虚拟形象的系统,可将文本转换为英国手语,声称能够传达语境意义和情感线索。
英国项目SignGPT获得845万英镑资金支持,正在开发英国手语和英语双向翻译模型,同时构建其所称的世界上最大的手语数据集。
手语人工智能研究也变得越来越具有协作性和国际化:一个价值350万英镑的英日研究项目正在开发基于聋人之间自然对话数据而非口译记录训练的系统。
这些最新进展中的大部分都来得很快。当伦敦大学学院聋哑、认知和语言研究中心SignGPT项目的联合调查员本西·沃尔教授首次进入英国手语研究领域时,聋人面对面交流之外的沟通极为有限。
"世界其他地方在技术上不断进步,但聋人往往被抛在后面,"她说。"现在不同的是速度。在过去几年里,聋人社区受益于爆炸性强大的可能性组合。"
沃尔警告说,从历史上看,技术并不总是积极的。"经常有一种幻想,特别是在不了解手语的研究人员中,认为这是一个快速解决方案。你拿一种手语,把它变成书面英语——你就让聋人的生活变得美好了,"她说。
这种假设导致了沃尔所说的"非常糟糕的技术",包括可穿戴翻译套装、笨重的手套和用于处理手语的头戴式摄像头。
"所有这些都注定要失败,"她说,"因为它们是由不了解手语的人设计的,没有询问聋人想要什么,更不用说从一开始就与聋人专家一起工作了。多年来,这个社区一直对糟糕解决方案的泛滥感到沮丧。"
然而,对解决方案的需求是真实的。全球约有7000万人是聋人或听力障碍者。在英国,人口普查数据记录了约15.1万英国手语使用者。对于其中约2.5万人来说,英国手语是他们的主要语言。这是一种具有自己语法和结构的独特自然语言,而不是英语的手语版本。
对于这一群体来说,书面和口头英语通常是第二语言,甚至是第三语言,排在唇读、手语支持英语或家庭发明的手势之后。
这具有实际后果:字幕和书面文本并不总是直接英国手语访问的充分替代品。2017年一项针对10至11岁聋儿的大型研究发现,仅使用口语教育的聋儿中有48%的阅读能力显著低于预期年龄水平,而日常语言为手语的聋儿中这一比例为82%。
劳伦·沃德博士在英国国家聋人协会(RNID)担任领导聋人社区人工智能技术的独特角色,为政府和行业提供建议。
"变化的速度如此之快,以至于RNID做出了雇用工程师的不寻常决定,"她说。"帮助聋人社区的潜力巨大——但造成伤害的潜力也很大。"
聋人长期以来一直是技术的早期采用者:短信在1990年代改变了沟通方式。但沃德表示,过去两年带来了新的关注和担忧强度。"它突然从大学实验室转移到初创公司和商业产品,"她说。
机器学习和相关技术的进步使大规模手语处理在技术上最终成为可能,这一转变得以实现。
研究资金增加、数据集改进以及聋人研究人员更多参与也加快了步伐,人们更广泛地认识到聋人法律上有权获得的访问权与实际提供的服务之间长期存在的差距:几十年来一直承诺提供可靠的手语服务,但往往未能实现。
沃德说,这种机遇与风险的结合使当前时刻成为一把双刃剑。
"这非常令人兴奋,未来五年可能会带来真正的改善,"她说。"但存在一个危险,即私营公司的回应是专注于利润,而不是与聋人社区合作并由他们领导。"
聋人学者和手语人工智能顾问玛尔提耶·德梅尔德博士同意风险很高。
"目前,聋人在很大程度上被排除在大量在线信息之外,从教育视频到政府网站,"她说。"没有人会有资源将整个互联网翻译成手语,所以即使是部分解决方案也可能具有变革性。"
伯明翰大学聋人研究员尼尔·福克斯同意,如果虚拟形象翻译达到足够的质量,它可以打开许多目前对聋人用户关闭的在线空间。
但所有人都非常谨慎。英国聋人协会首席执行官丽贝卡·曼塞尔表示,这"已成为一个非常有利可图的领域,太多项目仅象征性地让聋人参与"。
"一切都发生得非常快,存在真正的风险,即解决方案会强加给我们,"她补充道。
曼塞尔还提出了对监管和适当使用的担忧。"虚拟形象可能适合订购简单的东西,"她说,"但癌症诊断呢?在学校里,人类口译员往往是聋孩子唯一的朋友。"
来自Minderoo技术与民主中心、报告《英国手语不出售》的主要作者路易丝·希克曼博士在人工智能伦理领域工作了十年。
"许多公司声称他们可以在不了解英国手语的语言和文化复杂性的情况下解决这些问题,"她说。"目前的虚拟形象系统仍然缺乏人类口译员的细微差别,这在医疗和法律环境中造成了风险。"
希克曼还指出了可用数据的限制。"英国手语与爱尔兰手语或美国手语不同。英格兰内部也有地区方言。这意味着用于训练AI系统的可用数据极其有限。"
那么,她问道,适当的训练数据将从何而来?
"聋人社区想要创新,"她说,"但我们想放慢速度,以便我们能够塑造它,并确保它真正使我们受益。"
回到咖啡馆,创始人哈坎·埃尔比尔认为,除了他的静态英国手语视频菜单之外,几乎不需要更复杂的工具。
"人们谈论很多创新,但对于大多数聋人来说,它仍然是理论上的,"他说。"我想要的是为听力正常者提供有意义的日常互动。"
"咖啡只是借口,"他补充道。"我不需要复杂的技术来打破障碍。我只需要人们公开互动。"
在柜台等待拿铁的哈特维尔悄悄练习"馥芮白"的手语,证明正是这种由技术支持但不被技术掩盖的简单人际互动,每次用手语点一杯咖啡,都在吸引他回来。
Q&A
Q1:对话咖啡馆的触摸屏菜单有什么特别之处?
A:对话咖啡馆的触摸屏菜单不仅列出咖啡和蛋糕,还显示这些商品的英国手语翻译视频。这种设计让听力正常者可以学习手语点单,也为聋人提供了直接的手语访问方式,降低了双方沟通的焦虑感。
Q2:目前手语人工智能翻译技术存在哪些问题?
A:手语研究人员警告说,当前的手语AI工具仍难以处理语言细微差别、地区方言差异和具体语境,特别是在医疗诊断和法律等高风险环境中。虚拟形象系统还缺乏人类口译员的细微表达能力。此外,可用于训练AI系统的手语数据极其有限,因为不同国家甚至同一国家不同地区的手语都存在差异。
Q3:聋人社区对手语AI技术发展持什么态度?
A:聋人社区对手语AI技术持谨慎乐观态度。他们认可技术的巨大潜力,但担心私营公司只关注利润而忽视聋人真正需求。许多聋人专家表示希望放慢技术发展速度,确保聋人从一开始就深度参与技术开发,而不是仅被象征性地纳入,这样才能确保技术真正造福聋人社区。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.