网易首页 > 网易号 > 正文 申请入驻

全球首个!最懂甲骨文的AI来了!由厦门大学与腾讯、安阳师范学院联合研发

0
分享至

你只需往电脑上传一张甲骨图片,AI(人工智能)即可完成文字识别、释义查询、文献溯源——最懂甲骨文的AI来了!近日,厦门大学与腾讯公司、安阳师范学院联合研发的全球首个甲骨文智能体“殷契行止”正式上线。

厦门大学人工智能研究院甲骨文研究团队的负责人金泰松说,这是三方三年潜心研究的一个“合集”——一直以来,甲骨文研究一直面临“识别难、比对难、共享难”的挑战,“殷契行止”就是破解这些难题的智能体——AI用定制算法练就了读懂古文的真功夫。

用大白话说,“殷契行止”使得AI首次具备了“理解古文字”的能力,最终让每一片甲骨“读得懂、找得到、用得上”。

目前,甲骨文智能体已面向专家和公众免费开放,人人都能上手体验。

不过,金泰松说:“我们不是替代甲骨文研究专家,而是把专家从重复劳动中解放出来,让他们把精力留给真正的破译与思考。”


小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。

能做什么

看图识字

上传图片就能精准比对标准字库

只需上传一张含有甲骨文字的图片,AI就能精准比对甲骨文标准字库,看图识别出它是哪个甲骨文字,还能进一步检索系统知识库中有关该甲骨文字的相关资料,还会给出权威释义和参考文献。

识别出某个单字后,AI会自动查找这个字在哪些甲骨和拓片中出现过,快速定位相关资料。

针对某个单字,快速汇聚与之相关的学术研究成果、各家释读观点和演变历史,省下大量翻找资料的时间。


甲骨拓本

全自动甲骨校重

以图搜图 10分钟完成数年的工作

这个智能体还有拓片重见检索功能:相当于“甲骨文版以图搜图”。上传一张拓片照片,AI能快速比对海量数据库,找出同一片甲骨的不同拓片版本或有相似字形的其他甲骨,帮助研究者发现重复收录的文献或追踪甲骨流传轨迹。

甲骨拓本图像是研究甲骨文的基础。所谓“拓本”,核心是把龟甲、兽骨上的文字,用宣纸和墨“印”下来的成品,就是给甲骨上的字拍了张“黑白高清照”。从甲骨文首次发现至今,因为收藏、流转,大部分甲骨都留下了多个版本的拓本,这些拓本被称为重片,梳理重片的工作被称为校重。

可想而知,甲骨的拓本数量远远大于甲骨的数量,需要对这些重片进行系统整理,才能理清这笔“糊涂账”。因此,拓片校重是甲骨学一项重要的基础性整理工作,耗费了甲骨文研究学者大量时间。

团队开发的拓片校重和重见检索系统有效解决了一字多版难题,让AI学会“找字”,实现了全自动甲骨校重。原本需要专家耗时数年的比对工作,现在仅需10分钟即可完成。


甲骨文“门”字

拓本转化为摹本

不必借助临摹就能看清笔画细节

此外,运用AI还可以将甲骨拓本(类似碑文拓印的黑白图片),转化为甲骨文摹本(白底黑字的临摹图),方便研究者看清笔画细节。

在此之前,甲骨文摹本需要甲骨文研究者用笔一笔笔临摹,需要研究人员对甲骨文有较深的理解,并且非常费时费力。


甲骨文摹本

怎么用

小程序免费开放

可以跟AI直接对话

更酷的是,“殷契行止”使得甲骨文走向大众——目前,这个甲骨文智能体已面向专家和公众免费开放,人人都能上手体验。

简单来讲,无论你是深耕古文字的研究者,还是初识甲骨文的爱好者,都能借助它与3000年前的文字对话。

如果你是甲骨文研究者,可以在PC端登录“甲骨文AI协同平台”,使用AI研究工具智能识别、比对与检索甲骨文,显著提升研究效率。比如,上传图片后,你可以直接提问单字的释义,还可以问“这个字在哪里出现过?”AI会自动比对,快速找出包含该字的全部拓片和摹本。

如果你是古文字爱好者,只需打开微信小程序“了不起的甲骨文”,就能和智能体对话。

例如,你可以问它:“家”字的甲骨文长什么样?它不仅会展示字形,还会告诉你,这个字里藏着殷商时代的“居住”特点。

跟着“甲骨舞者”

学跳甲骨文体操

在“了不起的甲骨文”,人们还可以体验甲骨识读乐趣,获取古文字知识。

这个小程序还能让甲骨文翩翩起舞,金泰松介绍,安阳师范学院甲骨文信息处理教育部重点实验室牵头,联合音乐学院、体育学院等编创了一套“广播体操”,手机上轻轻一点,“甲骨舞者”就翩翩起舞,时而展示侧身而立的“人”字,时而表演张开双臂的“舞”字。

金泰松说,这位“甲骨舞者”是真人,这套甲骨文“广播体操”是为了帮助大家更好地理解和传播甲骨文。

此外,团队还打造了一系列甲骨文主题游戏,让普通人也能在有趣互动中,感受古文字的千年底蕴。


甲骨文“马”字

如何研发

三方合作

引入甲骨文针对性算法

金泰松说,随着DeepSeek(深度求索,一种AI助手)等通用大模型的涌现,我们意识到,AI确实能为甲骨文研究带来实质性的效率变革。基于这一认识,团队开始研发面向甲骨文识别的专用智能体。

什么叫智能体?金泰松列举一个例子,我们问DeepSeek:到北京的机票多少?它会告诉你价格,你还得自己去找App(应用程序)完成订票等工作;智能体却可以帮助你做其他的事情——你告诉特定的智能体:我要去北京,它会去查询相关的网站,调出支付的App等。表现在甲骨文智能体上,你上传一个甲骨单字,它可以自动去找这个字出现在哪片甲骨上,给出专家研究的文献等。

金泰松强调说,甲骨文智能体不是突然出现的,三年来,团队以AI+多模态甲骨文数据集融合为基础,研发出多项关键技术,包括甲骨字形检测与分类算法、AI摹本生成与字形匹配技术、甲骨校重与结构化比对算法,以及融合图像、文字与语义的多模态推理能力。

也就是说,现在相当于引入这些针对性的算法,用智能体技术把这些成果整合在“殷契行止”。

金泰松特别介绍三方合作的起源——2022年,在厦门大学纪荣嵘教授牵线下,厦门大学多媒体可信感知与高效计算教育部重点实验室、安阳师范学院甲骨文信息处理教育重点实验室与腾讯公司联合组建了跨机构研究团队。作为实验室主任,纪荣嵘在研究方向、技术路线优化、核心技术难题的攻坚突破中发挥关键作用。

金泰松是计算机专家,甲骨文智能化的研究与他参与研发的其他类型项目的感受是不一样的,他说,有时你会觉得,我们是在进行3000年文明的一场接力。

教AI认字

精准检测143万个字形

很多人疑惑的是,人工智能是如何认识甲骨文的?难道不是要建立在“投喂”的基础上?

金泰松解释,的确,项目的起点是最基础的字形识别。面对模糊不清的拓片,常规图像检测方法几乎失效。“拓片噪声干扰严重,笔画断裂,以‘庚’为例,同一个‘庚’字在不同时期形态各异,有的像铃铛,有的像劳动工具,有的因为刻痕太浅几乎难以辨认。”金泰松说,“这给视觉算法带来了巨大挑战。”

AI首先学会了“认字”,从模糊的拓片中提取清晰字形。就像教孩子识字一样,团队给AI展示了上千个“庚”字的拓片,告诉它:这些都是“庚”,虽然长得不太一样,但都是同一个字。经过数百次迭代,AI便学会了从模糊的拓片中精准识别出各种形态的“庚”字。

团队一步一步从底层图像处理做起,通过多尺度图像增强、去噪、去模糊等技术,处理破损的甲骨片,再不厌其烦地“教”AI“认字”,最终实现对143万个字形的精准检测,准确率超过90%。

让流失海外的甲骨在数字世界回归

“殷契行止”背后还有“数字甲骨共创计划”,目前,它已完成1525片甲骨的数字化采集工作,其中以数字化形式“回归”的流失海外的甲骨达950片。

也就是说,用AI让几千岁的甲骨文在数字世界里“团圆”。

这里有个背景,出土的甲骨不仅在中国,还分布在世界16个国家和地区。过去几年,“数字甲骨共创计划”的研究者分赴各地,凭借一盏灯和一台相机工作,现在,这些散落在海外的甲骨片都以数字形式回归到祖国。

据介绍,通过“数字甲骨共创计划”,研究团队已构建起全球规模最大的甲骨文多模态数据集,包含143万个甲骨文字形数据、1.5万片甲骨多模态数据、3000篇研究文献等。

2024年世界人工智能大会上,AI+多模态甲骨文数据集首次发布,供研究人员和公众免费使用。

【名词】

甲骨文

甲骨文主要流行于商周时期,距今3000多年,是迄今为止中国发现的年代最早的成熟文字系统,是汉字的源头和中华优秀传统文化的根脉。

百年殷墟考古中,一共出土16万片甲骨文,其中包含的单字大约有四五千个,但无数顶尖语言学家的百年探索,考释出、得到公认的约1500个,占比不到三分之一。

(厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拾石村妈祖被替后续: 女孩账号曝光,当了八年被选定,今年满18岁

拾石村妈祖被替后续: 女孩账号曝光,当了八年被选定,今年满18岁

离离言几许
2026-02-20 14:02:55
去的时候好好的,回来的时候却

去的时候好好的,回来的时候却

中国民航人
2026-02-21 18:07:25
娱乐圈「最美小三」复出,又翻红了

娱乐圈「最美小三」复出,又翻红了

独立鱼
2026-02-20 21:06:16
一觉醒来,关税大逆转又逆转

一觉醒来,关税大逆转又逆转

贩财局
2026-02-21 09:44:27
贺岁杯:中国香港代表队1-1首尔,点球大战5-4夺冠

贺岁杯:中国香港代表队1-1首尔,点球大战5-4夺冠

懂球帝
2026-02-21 17:37:05
谷爱凌惹上麻烦了

谷爱凌惹上麻烦了

行者殷涛
2026-02-20 20:16:47
秦昊夫妇现身沈阳,伊能静脸垮状态符合年纪,秦昊颈纹多很显憔悴

秦昊夫妇现身沈阳,伊能静脸垮状态符合年纪,秦昊颈纹多很显憔悴

楠楠自语
2026-02-21 19:44:57
阿富汗是这个世界的好老师

阿富汗是这个世界的好老师

名人苟或
2026-02-20 09:01:37
骨科医生紧急提醒:马上停止吃这种调味品,吃得越多,骨骼越脆!

骨科医生紧急提醒:马上停止吃这种调味品,吃得越多,骨骼越脆!

医哥聊健康
2026-02-20 15:56:49
爆:中国电信员工晒2025年终奖工资单!

爆:中国电信员工晒2025年终奖工资单!

通信头条
2026-02-20 20:42:28
2月21日俄乌最新:川普为何对俄罗斯比较“软”

2月21日俄乌最新:川普为何对俄罗斯比较“软”

西楼饮月
2026-02-21 20:37:43
美国权威媒体火力全开,嘲讽印度AI峰会如同闹剧,只会夸夸其谈

美国权威媒体火力全开,嘲讽印度AI峰会如同闹剧,只会夸夸其谈

呼呼历史论
2026-02-21 13:59:15
“日本制造”拼命撤离中国,释放什么信号

“日本制造”拼命撤离中国,释放什么信号

毒sir财经
2026-02-20 19:55:46
央行重磅潘石屹再次预判楼市!若无意外,未来楼市或迎3大走向

央行重磅潘石屹再次预判楼市!若无意外,未来楼市或迎3大走向

巢客HOME
2026-02-19 09:15:03
突发黑天鹅,全线闪崩!

突发黑天鹅,全线闪崩!

中国基金报
2026-02-21 18:51:52
黄一鸣回应公开孩子父亲身份:你不给抚养费,我就用你的流量赚钱

黄一鸣回应公开孩子父亲身份:你不给抚养费,我就用你的流量赚钱

TVB的四小花
2026-02-21 19:39:17
再见,NBA?场均4.6分+27%三分,28岁榜眼秀,无人问津啊,唏嘘

再见,NBA?场均4.6分+27%三分,28岁榜眼秀,无人问津啊,唏嘘

球童无忌
2026-02-21 21:34:11
“前方无厕所、无烤肠、无茶叶蛋”,杭州“天下第一财神庙”劝返游客:回家吧

“前方无厕所、无烤肠、无茶叶蛋”,杭州“天下第一财神庙”劝返游客:回家吧

极目新闻
2026-02-21 18:45:33
悲催!吉林网友哭诉,大年初四都没有人来给父亲拜年,电话都没有

悲催!吉林网友哭诉,大年初四都没有人来给父亲拜年,电话都没有

火山詩话
2026-02-21 07:10:06
特朗普签署行政令终止部分关税措施

特朗普签署行政令终止部分关税措施

每日经济新闻
2026-02-21 16:55:33
2026-02-21 21:59:00
厦门日报 incentive-icons
厦门日报
厦门日报是本地具有权威性、公信力和影响力的主流大报,全国百强报刊。
2448文章数 26733关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

消防车救火后返程坠崖6名消防员牺牲 村民:都是小伙子

头条要闻

消防车救火后返程坠崖6名消防员牺牲 村民:都是小伙子

体育要闻

冬奥第一"海王"?一人和13国选手都有关系

娱乐要闻

镖人反超惊蛰无声拿下单日票房第二!

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

旅游
健康
亲子
本地
军事航空

旅游要闻

新春环海东,一路山海一路年

转头就晕的耳石症,能开车上班吗?

亲子要闻

直接萌化了!小宝宝看着爸爸吃面条的样子心想:等你老了的

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

军事要闻

硬核揭秘!福建舰“一马当先”底气何在

无障碍浏览 进入关怀版