网易首页 > 网易号 > 正文 申请入驻

全球首个!最懂甲骨文的AI来了!由厦门大学与腾讯、安阳师范学院联合研发

0
分享至

你只需往电脑上传一张甲骨图片,AI(人工智能)即可完成文字识别、释义查询、文献溯源——最懂甲骨文的AI来了!近日,厦门大学与腾讯公司、安阳师范学院联合研发的全球首个甲骨文智能体“殷契行止”正式上线。

厦门大学人工智能研究院甲骨文研究团队的负责人金泰松说,这是三方三年潜心研究的一个“合集”——一直以来,甲骨文研究一直面临“识别难、比对难、共享难”的挑战,“殷契行止”就是破解这些难题的智能体——AI用定制算法练就了读懂古文的真功夫。

用大白话说,“殷契行止”使得AI首次具备了“理解古文字”的能力,最终让每一片甲骨“读得懂、找得到、用得上”。

目前,甲骨文智能体已面向专家和公众免费开放,人人都能上手体验。

不过,金泰松说:“我们不是替代甲骨文研究专家,而是把专家从重复劳动中解放出来,让他们把精力留给真正的破译与思考。”


小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。

能做什么

看图识字

上传图片就能精准比对标准字库

只需上传一张含有甲骨文字的图片,AI就能精准比对甲骨文标准字库,看图识别出它是哪个甲骨文字,还能进一步检索系统知识库中有关该甲骨文字的相关资料,还会给出权威释义和参考文献。

识别出某个单字后,AI会自动查找这个字在哪些甲骨和拓片中出现过,快速定位相关资料。

针对某个单字,快速汇聚与之相关的学术研究成果、各家释读观点和演变历史,省下大量翻找资料的时间。


甲骨拓本

全自动甲骨校重

以图搜图 10分钟完成数年的工作

这个智能体还有拓片重见检索功能:相当于“甲骨文版以图搜图”。上传一张拓片照片,AI能快速比对海量数据库,找出同一片甲骨的不同拓片版本或有相似字形的其他甲骨,帮助研究者发现重复收录的文献或追踪甲骨流传轨迹。

甲骨拓本图像是研究甲骨文的基础。所谓“拓本”,核心是把龟甲、兽骨上的文字,用宣纸和墨“印”下来的成品,就是给甲骨上的字拍了张“黑白高清照”。从甲骨文首次发现至今,因为收藏、流转,大部分甲骨都留下了多个版本的拓本,这些拓本被称为重片,梳理重片的工作被称为校重。

可想而知,甲骨的拓本数量远远大于甲骨的数量,需要对这些重片进行系统整理,才能理清这笔“糊涂账”。因此,拓片校重是甲骨学一项重要的基础性整理工作,耗费了甲骨文研究学者大量时间。

团队开发的拓片校重和重见检索系统有效解决了一字多版难题,让AI学会“找字”,实现了全自动甲骨校重。原本需要专家耗时数年的比对工作,现在仅需10分钟即可完成。


甲骨文“门”字

拓本转化为摹本

不必借助临摹就能看清笔画细节

此外,运用AI还可以将甲骨拓本(类似碑文拓印的黑白图片),转化为甲骨文摹本(白底黑字的临摹图),方便研究者看清笔画细节。

在此之前,甲骨文摹本需要甲骨文研究者用笔一笔笔临摹,需要研究人员对甲骨文有较深的理解,并且非常费时费力。


甲骨文摹本

怎么用

小程序免费开放

可以跟AI直接对话

更酷的是,“殷契行止”使得甲骨文走向大众——目前,这个甲骨文智能体已面向专家和公众免费开放,人人都能上手体验。

简单来讲,无论你是深耕古文字的研究者,还是初识甲骨文的爱好者,都能借助它与3000年前的文字对话。

如果你是甲骨文研究者,可以在PC端登录“甲骨文AI协同平台”,使用AI研究工具智能识别、比对与检索甲骨文,显著提升研究效率。比如,上传图片后,你可以直接提问单字的释义,还可以问“这个字在哪里出现过?”AI会自动比对,快速找出包含该字的全部拓片和摹本。

如果你是古文字爱好者,只需打开微信小程序“了不起的甲骨文”,就能和智能体对话。

例如,你可以问它:“家”字的甲骨文长什么样?它不仅会展示字形,还会告诉你,这个字里藏着殷商时代的“居住”特点。

跟着“甲骨舞者”

学跳甲骨文体操

在“了不起的甲骨文”,人们还可以体验甲骨识读乐趣,获取古文字知识。

这个小程序还能让甲骨文翩翩起舞,金泰松介绍,安阳师范学院甲骨文信息处理教育部重点实验室牵头,联合音乐学院、体育学院等编创了一套“广播体操”,手机上轻轻一点,“甲骨舞者”就翩翩起舞,时而展示侧身而立的“人”字,时而表演张开双臂的“舞”字。

金泰松说,这位“甲骨舞者”是真人,这套甲骨文“广播体操”是为了帮助大家更好地理解和传播甲骨文。

此外,团队还打造了一系列甲骨文主题游戏,让普通人也能在有趣互动中,感受古文字的千年底蕴。


甲骨文“马”字

如何研发

三方合作

引入甲骨文针对性算法

金泰松说,随着DeepSeek(深度求索,一种AI助手)等通用大模型的涌现,我们意识到,AI确实能为甲骨文研究带来实质性的效率变革。基于这一认识,团队开始研发面向甲骨文识别的专用智能体。

什么叫智能体?金泰松列举一个例子,我们问DeepSeek:到北京的机票多少?它会告诉你价格,你还得自己去找App(应用程序)完成订票等工作;智能体却可以帮助你做其他的事情——你告诉特定的智能体:我要去北京,它会去查询相关的网站,调出支付的App等。表现在甲骨文智能体上,你上传一个甲骨单字,它可以自动去找这个字出现在哪片甲骨上,给出专家研究的文献等。

金泰松强调说,甲骨文智能体不是突然出现的,三年来,团队以AI+多模态甲骨文数据集融合为基础,研发出多项关键技术,包括甲骨字形检测与分类算法、AI摹本生成与字形匹配技术、甲骨校重与结构化比对算法,以及融合图像、文字与语义的多模态推理能力。

也就是说,现在相当于引入这些针对性的算法,用智能体技术把这些成果整合在“殷契行止”。

金泰松特别介绍三方合作的起源——2022年,在厦门大学纪荣嵘教授牵线下,厦门大学多媒体可信感知与高效计算教育部重点实验室、安阳师范学院甲骨文信息处理教育重点实验室与腾讯公司联合组建了跨机构研究团队。作为实验室主任,纪荣嵘在研究方向、技术路线优化、核心技术难题的攻坚突破中发挥关键作用。

金泰松是计算机专家,甲骨文智能化的研究与他参与研发的其他类型项目的感受是不一样的,他说,有时你会觉得,我们是在进行3000年文明的一场接力。

教AI认字

精准检测143万个字形

很多人疑惑的是,人工智能是如何认识甲骨文的?难道不是要建立在“投喂”的基础上?

金泰松解释,的确,项目的起点是最基础的字形识别。面对模糊不清的拓片,常规图像检测方法几乎失效。“拓片噪声干扰严重,笔画断裂,以‘庚’为例,同一个‘庚’字在不同时期形态各异,有的像铃铛,有的像劳动工具,有的因为刻痕太浅几乎难以辨认。”金泰松说,“这给视觉算法带来了巨大挑战。”

AI首先学会了“认字”,从模糊的拓片中提取清晰字形。就像教孩子识字一样,团队给AI展示了上千个“庚”字的拓片,告诉它:这些都是“庚”,虽然长得不太一样,但都是同一个字。经过数百次迭代,AI便学会了从模糊的拓片中精准识别出各种形态的“庚”字。

团队一步一步从底层图像处理做起,通过多尺度图像增强、去噪、去模糊等技术,处理破损的甲骨片,再不厌其烦地“教”AI“认字”,最终实现对143万个字形的精准检测,准确率超过90%。

让流失海外的甲骨在数字世界回归

“殷契行止”背后还有“数字甲骨共创计划”,目前,它已完成1525片甲骨的数字化采集工作,其中以数字化形式“回归”的流失海外的甲骨达950片。

也就是说,用AI让几千岁的甲骨文在数字世界里“团圆”。

这里有个背景,出土的甲骨不仅在中国,还分布在世界16个国家和地区。过去几年,“数字甲骨共创计划”的研究者分赴各地,凭借一盏灯和一台相机工作,现在,这些散落在海外的甲骨片都以数字形式回归到祖国。

据介绍,通过“数字甲骨共创计划”,研究团队已构建起全球规模最大的甲骨文多模态数据集,包含143万个甲骨文字形数据、1.5万片甲骨多模态数据、3000篇研究文献等。

2024年世界人工智能大会上,AI+多模态甲骨文数据集首次发布,供研究人员和公众免费使用。

【名词】

甲骨文

甲骨文主要流行于商周时期,距今3000多年,是迄今为止中国发现的年代最早的成熟文字系统,是汉字的源头和中华优秀传统文化的根脉。

百年殷墟考古中,一共出土16万片甲骨文,其中包含的单字大约有四五千个,但无数顶尖语言学家的百年探索,考释出、得到公认的约1500个,占比不到三分之一。

(厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真实的赵丽颖,素颜出行,皮肤很黝黑,大家能接受吗?

真实的赵丽颖,素颜出行,皮肤很黝黑,大家能接受吗?

萧狡科普解说
2026-05-08 14:50:53
清朝“大辫子”到底多脏?满头油光,虱子满头,十步之内不能站人

清朝“大辫子”到底多脏?满头油光,虱子满头,十步之内不能站人

云霄纪史观
2026-05-07 20:06:19
两性关系:不论多大年龄,女人永远都想要这三大需求,男人该知道

两性关系:不论多大年龄,女人永远都想要这三大需求,男人该知道

皓皓情感说
2026-04-19 10:30:07
伊朗和俄罗斯,都对中国产生了严重的战略误判!

伊朗和俄罗斯,都对中国产生了严重的战略误判!

谈芯说科技
2026-05-08 19:28:15
建议大家:马桶冲水时,不能做这3个动作,危害很大,可别大意!

建议大家:马桶冲水时,不能做这3个动作,危害很大,可别大意!

家居设计师苏哥
2026-05-08 13:03:44
连环外放坑!深圳跑东莞企石下沙松山湖,返程死单耗疯网约车司机

连环外放坑!深圳跑东莞企石下沙松山湖,返程死单耗疯网约车司机

芭比衣橱
2026-05-09 01:32:24
和女同事去KTV,我喝多了半睡半醒间,竟然听到了上司偷吃的大瓜

和女同事去KTV,我喝多了半睡半醒间,竟然听到了上司偷吃的大瓜

千秋文化
2026-05-05 20:30:02
004核航母落空?美媒:除关键术落后,多个原因让中国没必要造它

004核航母落空?美媒:除关键术落后,多个原因让中国没必要造它

春序娱乐
2026-05-09 00:59:55
炸锅!38:6 表决爆分歧,军方放话一锅端,菲律宾政坛要变天?

炸锅!38:6 表决爆分歧,军方放话一锅端,菲律宾政坛要变天?

福禄表嫂
2026-05-06 09:03:44
第二个恶魔医生被抓,郑大一附院王福建为94名患者植入不需要器械

第二个恶魔医生被抓,郑大一附院王福建为94名患者植入不需要器械

大鱼简科
2026-02-18 22:03:00
巴拉圭总统窜台挑衅!中方24小时内下通牒,“断交” 倒计时开始

巴拉圭总统窜台挑衅!中方24小时内下通牒,“断交” 倒计时开始

轩逸阿II
2026-05-09 02:32:26
南宋为洗靖康之耻有多狠?700万金人仅剩10万,辱金后还留一画作

南宋为洗靖康之耻有多狠?700万金人仅剩10万,辱金后还留一画作

掠影后有感
2026-05-07 10:01:40
51集谍战大剧来袭,连续4天全国第一!果然央视没有看走眼

51集谍战大剧来袭,连续4天全国第一!果然央视没有看走眼

阿乐乐电影v
2026-05-07 15:48:19
李赛凤的乱伦,床缝摸出个用过的套,衣柜里还藏着个半裸的干儿子

李赛凤的乱伦,床缝摸出个用过的套,衣柜里还藏着个半裸的干儿子

西楼知趣杂谈
2026-04-26 10:18:11
足协强硬表态!世界杯期间中超不停摆,联手央视硬刚国际足联

足协强硬表态!世界杯期间中超不停摆,联手央视硬刚国际足联

漫川舟船
2026-05-09 03:25:57
16岁女生玩秋千坠亡后续:多视角曝光,死因非没绑紧,细节披露

16岁女生玩秋千坠亡后续:多视角曝光,死因非没绑紧,细节披露

李晚书
2026-05-06 13:21:59
王曼昱轻松击败申裕斌,为何孙颖莎赢金娜英艰难?马琳贡献表情包

王曼昱轻松击败申裕斌,为何孙颖莎赢金娜英艰难?马琳贡献表情包

体育大学僧
2026-05-08 09:39:34
Siegel:科尔希望格林下赛季回归勇士 三人未来能一同谢幕

Siegel:科尔希望格林下赛季回归勇士 三人未来能一同谢幕

北青网-北京青年报
2026-05-08 20:26:11
不用命令行的Claude Code用户,靠这4个VS Code插件续命

不用命令行的Claude Code用户,靠这4个VS Code插件续命

闪存猎手
2026-05-08 01:31:08
高人预测:5年后,持有燃油车的家庭,将面对3个现实问题!

高人预测:5年后,持有燃油车的家庭,将面对3个现实问题!

秋枫凋零
2026-04-18 13:15:12
2026-05-09 04:00:49
厦门日报 incentive-icons
厦门日报
厦门日报是本地具有权威性、公信力和影响力的主流大报,全国百强报刊。
2526文章数 26745关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

本地
亲子
时尚
旅游
军事航空

本地新闻

用苏绣的方式,打开江西婺源

亲子要闻

北京儿童配眼镜指南:从看得清到管得住,守住孩子的视力第一条防线

衣服其实没有必要买很贵,准备这三件基础款,百搭实用又不挑人

旅游要闻

社评:中国的“Country Walk”何以吸引西方年轻人

军事要闻

伊朗:最高领袖穆杰塔巴全面掌控局势

无障碍浏览 进入关怀版