网易首页 > 网易号 > 正文 申请入驻

独家!哈工大斩获AI顶会ACL评审阶段最高分,让AI领略汉字之美

0
分享至

  新智元报道

  编辑:定慧 好困

  【新智元导读】哈工大论文斩获ACL评审阶段已知最高分!考虑到英文键盘难以适配汉字特点及文化内涵,团队通过传感器捕捉手部书写,实现汉字的自然输入与识别;独创的中文字形编码使AI能深入理解汉字形态而非仅关注词义,推动AI从「识字」迈向「解字」。该研究革新了中文人机交互,推动了汉字文化传播与传承,更为AI深度理解汉字智慧开辟了新道路。

  独家消息!

  AI顶会ACL 2025评审阶段最高分论文出炉!

  ACL 2025评审阶段得分官方统计

  这篇题为「Chinese Inertial GAN for Handwriting Signal Generation and Recognition」的论文,作者是来自哈工大的王一峰博士和赵毅教授。

  根据ACL组委官方发布的评分分布,其Average Overall Assessment为目前最高的4.5分。

  值得一提的是,这篇论文在Meta Review阶段,和的分数一样,都是4.5(Borderline Award)。

  ACL 2025年最佳论文的竞争者再添一名,而且都是中国的,真是可喜可贺!

  论文介绍

  在人工智能浪潮席卷全球的今天,一项融合中华文化与前沿科技的研究,以其独特的人机交互探索在国际AI顶会中赢得所有评审的认可,让民族文化瑰宝闪耀于世界科技舞台。这背后蕴藏着怎样的创新价值与文化意义?

  在全球范围内,有超过14亿人使用汉字。

  这种古老的象形文字不仅承载着数千年的中华文明,还对日语、韩语和越南语等其他亚洲语言文字体系产生了深远影响。

  然而,作为人机交互的传统工具,基于键盘的输入方式主要是为英文、法文等以字母为基础的拉丁语言设计的,难以完美适配汉字这种具有丰富笔画和复杂结构的文字。

  象形文字的独特之处在于,其笔画与结构本身就蕴含着丰富的语义信息,而这些信息又在书写过程中自然地融入了手部的运动之中。

  为此,来自哈尔滨工业大学的团队提出了一种全新的、面向象形文字的人机交互方法。

  通过广泛集成在智能手机和可穿戴设备中的微型惯性传感器,捕捉用户手部的细微书写动作,实现汉字的精准识别与高效输入,从而在人机交互中还原汉字书写的自然体验。

  更重要的是,汉字的书写动作乃至最终呈现的书法形态,不仅反映其语义内容,更承载着深厚的文化底蕴和独特的美学价值。

  因此,这项技术不仅为中文用户提供了一种新颖、高效的人机交互选择,更有助于汉语学习者深入理解汉字构造,促进中华汉字文化的代际传承与国际传播。

  然而,汉字博大精深,数量庞多,因此人机交互技术的核心挑战在于高质量、大规模训练数据的匮乏。

  为此,研究团队设计了一种「中文惯性生成对抗网络(CI-GAN)」。

  作为驱动人机交互的「生成式数据引擎」,CI-GAN能够智能地生成无限量、高度逼真的虚拟书写惯性信号,从而赋能不同的人机交互场景。

  中文惯性生成对抗网络框架图

  实验结果显示,在CI-GAN提供的海量数据支持下,不同架构的模式识别方法性能都得到了显著提升,其中Transformer架构的识别准确率从原来的不足10%暴涨到98%。

  CI-GAN的卓越性能源于其内部三个模块的精妙设计与协同运作,它们相互支撑,构成了一个高效、智能的耦合系统:

  中文字形编码(CGE)

  CGE可以看成是生成模型的promote,它通过对汉字进行编码,从而告诉CI-GAN需要生成哪些汉字。

  传统编码方式往往只关注汉字的「词义」,忽略了其作为象形文字最根本的「形态」特征。

  CGE模块则为每个汉字构建了独特的「字形身份证」,专门表征其笔画走势和结构布局。

  它通过一种基于信息熵(Rényi entropy)的正则化方法,确保不同汉字的字形编码既信息丰富又易于区分。

  这使得CGE不仅为后续的笔迹生成提供了精确的引导,更让AI拥有了洞察汉字形态结构的能力。

  强制最优传输(FOT)

  为了确保AI生成的虚拟笔迹信号无限接近真人的书写习惯,FOT模块建立了一套严格的「三重一致性」约束机制。

  它不仅确保了输入汉字的字形特征、AI生成的笔迹特征以及真实笔迹样本特征三者之间的高度吻合,还有效避免了传统生成模型中常见的模式崩溃或模式混叠等问题,从而保证了生成样本的真实性与多样性。

  语义关联性对齐(SRA)

  汉字体系博大精深,不同汉字结构之间存在着复杂的关联性。

  SRA模块约束AI在生成信号时准确保持这种汉字间的细微关联(例如,字形结构相似的汉字,其生成的笔迹信号在动态特征上也应表现出相似性,反之亦然)。

  这不仅大幅提升了生成信号的整体协调性和逻辑性,还有效抑制了生成式AI可能出现的幻觉问题。

  语义关联性对齐原理图

  此外,汉字字形编码(CGE)、强制最优传输(FOT)、语义关联性对齐(SRA)三个模块相互协同:

  CGE不仅为生成器从输入端提供语义引导,同时也为FOT和SRA的约束机制提供语义依据,并且CGE自身也在此过程中得到监督和训练;

  FOT模块利用CGE提供的字形编码,确保生成信号的语义、真实信号的语义以及输入语义三者一致;

  SRA模块同样依据CGE提供的字形编码,校对生成信号之间的语义关联性,确保其与对应输入汉字之间的字形关联性的一致性;

  FOT与SRA模块除了共享CGE提供的字形编码外,还共享生成信号的特征,从而分别向生成信号施加约束,确保生成信号的真实性、可靠性、多样性。

  CGE-FOT-SRA协同交互示意图

  这项研究的价值不仅在于提供了一种人机交互技术。

  更重要的是,其核心组件「中文字形编码(CGE)」为AI开启了一扇理解象形文字内在「形态逻辑」的大门。

  汉字作为一种源远流长的表意文字体系,其字形并非随机符号的堆砌,而是蕴含着丰富的结构信息和语义线索。

  与拼音文字不同,汉字的字形与语义之间存在直观的形态关联(如「日」象形太阳,「山」酷似山峰剪影,「火」宛若跳动火焰,「网」象征交错纵横的网络),这些字形本身就承载着浓厚的语义信息和文化密码。

  这种表意特性可以为AI提供更密集的信息,使其能够从字形中直接解码部分语义。

  大量研究指出,中文的平均信息熵远高于英语等表音文字,意味着用更少的字符就能传递同等复杂的信息(不同语言的联合国文件中,中文版往往是篇幅最短的)。

  然而,作为AI理解人类语言的基石,当前的中文向量化方法本质上是将汉字视作随机符号,忽视了汉字内部的结构信息和字形本身所蕴含的丰富先验知识。

  这项研究用传感器捕捉汉字书写,并将这一过程看成是对字形的动态形成过程的记录,从而设计汉字字形编码(CGE)在这一过程中学习和表征汉字的形态结构信息。

  因此,CGE可以将汉字的结构与笔画特征引入深度学习架构,让AI从仅仅「识字」进化到一定程度的「解字」。

  当AI能够理解「氵」多与水有关,「亻」多与人有关,「讠」多与说话有关,「钅」多与金属相关,「火」多与火焰有关时,它对中文语料的利用就可以更加高效,对整个中文知识体系的理解也更为深刻。

  这种基于运动捕捉的汉字字形结构表征可以捕捉细微的结构差异,例如「千-干」、「天-夭」、「田-甲」,使得AI对语言的理解不只是来自于上下文预测这种基于统计学规律的知识表征。

  某种程度上,CGE为AI理解人类知识提供了一个独立于纯文本统计之外的强大信息源,揭示了人工智能在理解和利用汉字这一古老而智慧的文字体系时所蕴藏的巨大潜力。

  本研究的深层启示在于:对于具有内部结构和非任意性形态的符号系统(尤其是如汉字这样的表意文字),对其「形态逻辑」进行建模可能是提升AI认知能力的有效途径。

  CGE作为一种初步的尝试,验证了这一思路的可行性,对AI的符号学习和表征学习可能产生深远影响。

  此外,汉字的「形」,作为其「意」的重要载体,理应在未来的AI研究中占据更核心的位置,这可能是推动人工智能向更高层次认知智能迈进的关键路径之一。

  作者介绍

  王一峰

  哈工大博士生,受国家留学基金委资助,赴新加坡国立大学进行博士联合培养,研究方向包括AI物理感知、可解释性分析等。

  他曾担任国际生物信息与生物医学工程会议(BIBE)、计算机技术与信息科学国际会议(CTIS)、机器人自动化与智能控制国际会议(ICRAIC)分会主席,CVPR、ECCV、AAAI、Information Fusion等人工智能顶级会议/期刊审稿人。

  赵毅

  哈工大教授,应用数学研究中心主任和学科学术带头人,英国数学与应用学会会士,广东省数学会理事,广东省工业与应用数学学会常务理事。

  研究方向包括应用动力系统、非线性时间序列分析、复杂网络和数据科学理论等。近五年以第一/通信作者发表SCI论文60余篇,其中3篇论文入选ESI高被引论文。

  参考资料:

  https://drive.google.com/file/d/1IzkWMe0S0pfoBjYC5Z-vxLedOaQZXjgL/view?usp=drive_link

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
看了姚晨的旧照,才明白凌潇肃曹郁为啥相继沦陷了,嘴大不是缺陷

看了姚晨的旧照,才明白凌潇肃曹郁为啥相继沦陷了,嘴大不是缺陷

八斗小先生
2026-03-20 15:24:18
通用丰田等联名致函:敦促美国继续限制进口中国车

通用丰田等联名致函:敦促美国继续限制进口中国车

快科技
2026-03-24 11:18:08
日本一留学生的帖子爆火!日本网友对不同国家和颜值的外国留学生,态度竟然差这么多?!

日本一留学生的帖子爆火!日本网友对不同国家和颜值的外国留学生,态度竟然差这么多?!

东京新青年
2026-03-25 18:41:06
泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

TVB的四小花
2026-03-26 12:18:20
张雪峰给女儿的底气:名字变商标,这就是中国式父爱!

张雪峰给女儿的底气:名字变商标,这就是中国式父爱!

喜欢历史的阿繁
2026-03-26 13:06:57
14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

红星新闻
2026-03-24 23:25:19
张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

水晶的视界
2026-03-26 09:28:29
辞职刚4天,通报就来了:这位副总,想跑没跑掉

辞职刚4天,通报就来了:这位副总,想跑没跑掉

老鹰哥
2026-03-25 12:17:52
4月越忙越富的三生肖曝光:好运风口已至,一路上坡顺风顺水!

4月越忙越富的三生肖曝光:好运风口已至,一路上坡顺风顺水!

毅谈生肖
2026-03-26 10:54:48
养生|大便后你用几张纸?用纸量判断你的身体情况

养生|大便后你用几张纸?用纸量判断你的身体情况

A活着
2026-03-24 19:25:23
省政府领导班子密集调整,省委常委任常务副省长

省政府领导班子密集调整,省委常委任常务副省长

上观新闻
2026-03-25 15:46:23
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
1950年女地下党被捕,枪毙前高呼:我可以招,但我要见哥哥

1950年女地下党被捕,枪毙前高呼:我可以招,但我要见哥哥

云霄纪史观
2026-03-26 11:04:00
兄弟俩同出宁海路,一个资产清零,一个负债率28%稳坐前500强

兄弟俩同出宁海路,一个资产清零,一个负债率28%稳坐前500强

花小猫的美食日常
2026-03-26 07:41:46
火箭3将成大麻烦!杜兰特难破包夹,谢泼德不稳,伊森已成毒瘤!

火箭3将成大麻烦!杜兰特难破包夹,谢泼德不稳,伊森已成毒瘤!

篮球资讯达人
2026-03-26 13:25:09
巫启贤曝综艺剧本,如若拆穿节目组要赔钱,只能装作认不出李克勤

巫启贤曝综艺剧本,如若拆穿节目组要赔钱,只能装作认不出李克勤

歪歌社团
2026-03-24 04:08:26
志愿军功臣行刑时朝鲜姑娘冲上前,彭总感慨:让他们在一起吧

志愿军功臣行刑时朝鲜姑娘冲上前,彭总感慨:让他们在一起吧

老范谈史
2026-03-23 17:49:13
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
女大学生住院做检查,报告竟是假的!珠海中山五院等多方回应

女大学生住院做检查,报告竟是假的!珠海中山五院等多方回应

南方都市报
2026-03-24 12:42:25
2026年身份证就是老年证!爸妈满60岁别办证,这4件事千万不能忘

2026年身份证就是老年证!爸妈满60岁别办证,这4件事千万不能忘

复转这些年
2026-03-26 09:26:17
2026-03-26 13:44:50
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14819文章数 66720关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
手机
艺术
亲子
公开课

教育要闻

2027届注意:暑期实习=秋招通行证,错过等一年

手机要闻

三星One UI 9前瞻:小部件更方正、Now Bar动画更丝滑

艺术要闻

哪一座桥不是风景?

亲子要闻

躺平的孩子意外觉醒了,在父母学会当“乌龟”!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版