网易首页 > 网易号 > 正文 申请入驻

AI读懂两千年前文字,登上Nature封面,惊艳历史学家

0
分享至

本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。

智东西(公众号:zhidxcom)

编译 | ZeR0

编辑 | 漠影

智东西3月10日消息,今日,DeepMind的“AI+科学”研究,再登国际学术顶刊Nature的封面!

DeepMind的深度神经网络Ithaca,能从受损文物中破译古希腊文字,准确率达到62%,在识别其原始位置方面的准确率达到71%,还能将古文字年代锁定在其真实日期范围的30年内。

据悉,这是第一个能够恢复受损铭文的缺失文字、识别其原始位置并帮助确定其书写日期的深度神经网络

研究结果表明,AI能帮助历史学家更好地解读铭文,以助力对古代历史的论证与理解。当前,历史学家已经使用这个工具,来重新评估希腊历史上的重要时期。

为了让研究人员、教育工作者、博物馆工作人员和其他人能够广泛使用其研究,DeepMind与谷歌云和谷歌Arts & Culture合作,推出了Ithaca的免费互动版本,并开放了其代码、预训练的模型和一个交互式的协作实验室笔记本。

论文链接:

https://www.nature.com/articles/s41586-022-04448-z

开源地址:

https://github.com/deepmind/ithaca

互动版本:

https://ithaca.deepmind.com

一、古文字遭破坏?AI能修复这个bug

文字的诞生标志着历史的开端,对人类理解过去的文明和今天生活的世界至关重要。

例如,2500多年前,希腊人开始在石头、陶器和金属上书写,记录从租约、法律到日历和预言的一切,让人们对地中海地区有了详细的了解。不幸的是,这是一个不完整的记录。

许多幸存下来的铭文在几个世纪的时间里遭到了破坏,或者从原来的位置被移走了。此外,现代年代测定技术,如放射性碳年代测定法,无法在这些材料上使用,这使得解读铭文既困难又费时。

为此,DeepMind与威尼斯Ca’Foscari大学人文系、牛津大学古典系、雅典经济与商业大学信息学系合作,一起探索如何用AI帮助历史学家更好地解读这些铭文。

深度神经网络Ithaca即是他们的最新成果,它以荷马史诗《奥德赛》中的希腊岛屿命名,在DeepMind此前专注于文本修复的系统Pythia基础上扩展而成。

从实验结果来看,这个新算法展示了AI方法能克服现有恢复铭文方法的约束,辅助古语言研究,并帮助对古代历史有更丰富的理解。

二、大幅提升修复受损古文字的准确率

Ithaca采用了古希腊语言和整个古代地中海世界的铭文进行训练,训练数据来自帕卡德人文学院提供的最大的希腊铭文数字数据集。

这一选择有两个主要原因。首先,希腊铭文记录的内容和背景的变异性使其成为语言处理的巨大挑战;其次是因为古希腊语数字化语料库的可用性,这是训练机器学习模型的基本资源。

自然语言处理(NLP)模型通常用单词(word)进行训练,因为它们在句子中出现的顺序和它们之间的关系提供了额外的上下文和含义。然而,许多历史学家有兴趣让Ithaca进行分析的铭文都已损坏,而且经常缺失文本块。

DeepMind使用单词和单个字符作为输入来训练模型,以确保Ithaca用这类文本时能正常工作。模型核心的稀疏自我注意机制并行地评估这两个输入,允许Ithaca根据需要评估铭文。

Ithaca的架构(文本的损坏部分用“-”表示)

实验结果表明,Ithaca的设计决策和可视化辅助使研究人员更容易解释结果。

单独工作时,Ithaca在修复受损文字方面达到了62%的准确率;与DeepMind合作的历史学家在单独修复古代文献时,准确率为25%;而当历史学家与Ithaca合作时,修复受损文字的准确率提高至72%。

Ithaca的实验结果(CER和年份,数值越低↓越好)

Ithaca还可以确定铭文书写的原始地理位置,准确率达到71%,并能将铭文的书写年代缩小至与历史学家提出的日期相差30年以内。

研究人员认为,AI和历史学家之间的这种合作,可能有助于改变对古代世界的研究,比如帮助推进历史解释,建立历史事件的相对日期,乃至为当前的方法论争鸣做贡献。

例如,目前历史学家对雅典颁布的一系列重要法令的日期存在分歧,这些法令是在苏格拉底和伯里克利等著名人物在世的时期颁布的。

这些法令一直被认为是在公元前446/445年之前写的,尽管有新的证据表明日期是公元前420年。虽然看起来差别不大,但这些法令对于理解古典雅典的政治史至关重要。

DeepMind采用的训练数据集包含公元前446/445年的早期图像。为了测试Ithaca的预测,研究人员在一个不包含日期铭文的数据集上对它进行了重新训练,然后提交这些没被包含在数据集中的文字进行分析。结果,Ithaca对这些法令的平均预测日期是公元前421年,这与新证据推测的日期一致。

由此可见,机器学习能帮助围绕希腊历史上最重要时刻之一的辩论提供支撑。

三、提供可视化辅助工具,直观呈现AI分析的结果

为了将Ithaca作为研究工具的价值最大化,研究团队还创造了一些可视化辅助工具,来确保历史学家能够轻松地解释Ithaca输出的结果。

Ithaca的输出

(1)修复假设:Ithaca为文本修复任务生成了几个预测假设,供历史学家利用专业知识进行选择。

(2)地理属性:Ithaca向历史学家展示了它的不确定性,它给出了所有可能预测的概率分布,而不是单一的输出。它提供了84个不同古代地区的概率,代表其确定性水平,并将这些结果可视化显示在地图上,以阐明古代世界潜在的地理联系。

(3)时间归属:当确定文本的创作日期时,Ithaca会产生一个从公元前800年到公元800年所有几十年的预测日期分布。历史学家能看到模型对特定日期范围的可信度,这可能提供有价值的历史见解。

(4)显著性图:为了将结果传达给历史学家,Ithaca使用了计算机视觉中常用的一种技术,它可以识别哪些输入序列对预测的贡献最大。该输出对影响Ithaca关于缺失文本、位置和日期预测的单词用不同的颜色加以突出。

由颜色标注突出显示了Ithaca聚焦的词

结语:AI与人文学科的合作正释放出更大潜力

DeepMind研究团队相信,这只是像Ithaca这样的AI工具的开始。

古希腊只是全球文明图景的一部分,DeepMind还在研究由其他古代语言训练的Ithaca版本,历史学家已经可以在当前的建筑中使用他们的数据集来研究阿卡德语、希伯来语、玛雅语等古代文字体系。

我国的研究团队也早已开展了用AI识别古文字的研究。在2021年世界人工智能大会上,国内智能文字识别领域头部企业合合信息就曾展示一种将古代象形文字甲骨文识别并翻译成现代汉字的AI技术,这不仅有助于实现甲骨文研究资料电子化、数据化,也为破解甲骨文谜题提供了新的数字化手段。

合合信息用AI识别翻译甲骨文

我们期待看到更多诸如此类的研究,可以释放AI和人文学科之间的合作潜力,改变历史学家研究和确定人类历史重要时期的方式,帮助我们获得对古代文明更丰富的认知。

来源:DeepMind,Nature

责任编辑:曹逸群_NB19194

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王金平深夜发声亮出三大立场,台海和平才是民心所向

王金平深夜发声亮出三大立场,台海和平才是民心所向

果妈聊娱乐
2026-07-03 17:03:38
没有证据?那就发明证据!从中国第一“女福尔摩斯”到冤案制造者

没有证据?那就发明证据!从中国第一“女福尔摩斯”到冤案制造者

许三岁
2026-06-24 11:06:59
1937年,他下令活埋2609名红军,12年后被认出:你化成灰我也认得

1937年,他下令活埋2609名红军,12年后被认出:你化成灰我也认得

磊子讲史
2026-07-02 15:30:38
大闹车站女子彻底“社死”,“底裤”被扒正脸流出,结局大快人心

大闹车站女子彻底“社死”,“底裤”被扒正脸流出,结局大快人心

好贤观史记
2026-07-03 14:16:05
台学者爆料:大陆可能已在筹备“台湾特区”,统一进程比你想的快

台学者爆料:大陆可能已在筹备“台湾特区”,统一进程比你想的快

故事终将光明磊落
2026-07-03 10:56:28
原来他俩已离婚,如今一个在日本孤独终老,一个在上海娶将军之女

原来他俩已离婚,如今一个在日本孤独终老,一个在上海娶将军之女

白面书誏
2026-06-25 15:05:12
52 岁方琼回农村喝喜酒,状态嫩得像 30 岁,独自坐板凳上玩手机

52 岁方琼回农村喝喜酒,状态嫩得像 30 岁,独自坐板凳上玩手机

南万说娱26
2026-04-22 12:10:10
当你老了,如果不幸和兄弟姐妹断交了,记住这两句话,你就赢了

当你老了,如果不幸和兄弟姐妹断交了,记住这两句话,你就赢了

心理观察局
2026-07-01 08:20:10
林志颖捂了12年的kimi,首次公开正面照,网友:这脸,判若俩人……

林志颖捂了12年的kimi,首次公开正面照,网友:这脸,判若俩人……

可读
2026-06-25 23:21:52
世界杯头号水货!葡萄牙世一中隐身全场!C 罗全队险些被他坑惨了

世界杯头号水货!葡萄牙世一中隐身全场!C 罗全队险些被他坑惨了

澜归序
2026-07-03 09:48:01
7.4世界杯足球赛事参考:2场焦点分析

7.4世界杯足球赛事参考:2场焦点分析

小轻舟
2026-07-04 06:03:36
王楚钦输球后24小时内丑事频发不止一件

王楚钦输球后24小时内丑事频发不止一件

绚丽的画卷
2026-07-04 00:18:52
曾向传奇穆里尼奥许愿的凯恩,愿望得以实现:想和梅西、C罗一样

曾向传奇穆里尼奥许愿的凯恩,愿望得以实现:想和梅西、C罗一样

福酱的小时光
2026-07-04 07:42:43
今天C罗展示的贵族精神,梅西很可能都做不到

今天C罗展示的贵族精神,梅西很可能都做不到

人格志
2026-07-04 01:53:18
《四渡》:3.5亿就拍了个“赵德发传奇”?别拿主旋律当遮羞布

《四渡》:3.5亿就拍了个“赵德发传奇”?别拿主旋律当遮羞布

浪子说
2026-07-03 14:59:43
男篮一人被郭士强坑惨!错过去NBA打夏联,国家队比赛又坐冷板凳

男篮一人被郭士强坑惨!错过去NBA打夏联,国家队比赛又坐冷板凳

弄月公子
2026-07-04 07:22:39
2026车市最大骗局:省油电车全亏钱,烂大街油车才是真赢家

2026车市最大骗局:省油电车全亏钱,烂大街油车才是真赢家

民间胡扯老哥
2026-05-24 13:40:40
够狠!王励勤终于动真格的了,直接砍掉前主席的后花园

够狠!王励勤终于动真格的了,直接砍掉前主席的后花园

以茶带书
2026-06-21 16:00:21
危险堪比核弹,需中国帮忙监控,萨雷兹湖为何令中亚四国胆战心惊

危险堪比核弹,需中国帮忙监控,萨雷兹湖为何令中亚四国胆战心惊

月光作笺a
2026-06-28 01:35:31
6月新势力销量:零跑9.3万台一骑绝尘,网友:性价比这块没对手!

6月新势力销量:零跑9.3万台一骑绝尘,网友:性价比这块没对手!

言车有徐
2026-07-01 16:32:08
2026-07-04 09:15:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12175文章数 117119关注度
往期回顾 全部

艺术要闻

这位女子,在画坛默默无闻,作品清新质朴

头条要闻

牛弹琴:很罕见 普京突然穿上了军装

头条要闻

牛弹琴:很罕见 普京突然穿上了军装

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

本地
数码
房产
旅游
公开课

本地新闻

国内足球之旅?这座小城给你高分答案

数码要闻

消息称Apple Watch Series 12表带内嵌传感器,支持血糖监测等

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

旅游要闻

全部免费!郑州7月4日-7月5日周末活动推荐

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版