网易首页 > 网易号 > 正文 申请入驻

谷歌开源AI工具Aeneas,辅助历史学家高精度修复、断代及溯源铭文

0
分享至

在博物馆幽暗的灯光下,一块残破的古罗马石碑静静地躺在展柜中。石碑上的拉丁文铭刻着早已逝去的时代信息,但岁月侵蚀和人为破坏让大部分文字变得模糊不清、难以辨认。对于历史学家和考古学家而言,解读这些被称为“历史最初手稿”的铭文,是一项极其重要却又无比艰辛的工作。现在,来自谷歌的 AI 或许能让这项工作变得轻松一些。

谷歌 DeepMind 与多所大学的历史学家合作,于 2025 年 7 月 23 日在《自然》(Nature)上发表了一项最新研究成果,推出了一款名为“埃涅阿斯”(Aeneas)的 AI 工具。这款以古罗马神话中特洛伊英雄命名的程序,旨在帮助研究人员解读、修复和考证那些饱经沧桑的古罗马拉丁文铭文。它不仅能以高准确率填补铭文中缺失的文字,还能推断出铭文的制作年代和地理来源。


图丨相关论文(来源:Nature)

古罗马人留下了海量的铭文,它们被刻在纪念碑、祭坛、墓碑、陶器甚至涂鸦墙上,内容包罗万象,从皇帝的法令、战争的记录,到商人的账本、情人的诗篇,为后世了解罗马世界的政治、经济、文化乃至普通人的日常生活提供了最直接、最鲜活的证据。与史官笔下的“胜利者书写的历史”不同,这些铭文是古罗马社会各阶层人士的真实心声。然而,解读它们的过程却相当困难。


(来源:Nature)

这些铭文常常以碎片的形态被发现,或者文字因风化而变得模糊不清,许多关键信息就此丢失。学者们在研究时,需要依靠自身的知识和丰富的经验,在浩如烟海的文献资料库中寻找可供参照的“平行文本”(parallels)——即那些在措辞、句法、格式或出处上相似的其他铭文。通过对比分析,他们才能逐步拼凑出碎片化的信息,推断缺失部分的内容,并将其置于更广阔的历史背景中进行解读。这一过程不仅耗时耗力,而且高度依赖学者的个人专长和所能接触到的图书馆资源,往往会限制研究的广度和深度。

DeepMind 的研究员 Yannis Assael 和诺丁汉大学的历史学家 Thea Sommerschield 博士领导的团队开发的 Aeneas,正是为了解决这一难题。Aeneas 的核心能力并不是单纯的文本匹配,而是深度“语境化”(contextualizing)。其基于一个名为“拉丁文铭文数据集”(LED,Latin Epigraphic Dataset)的数据集训练而成,这是一个庞大的数据库,整合了来自罗马铭文数据库(EDR,Epigraphic Database Roma)、海德堡铭文数据库(EDH,Epigraphic Database Heidelberg)等多个权威来源的数据,包含了超过 17.6 万条拉丁文铭文,总字符数高达 1,600 万个。

基于这个庞大的数据集,Aeneas 采用了一种基于 Transformer 架构的深度神经网络。它不仅仅是分析铭文的文本内容,还能在某些情况下结合铭文的图片进行多模态分析(multimodal analysis)。当研究人员输入一段残缺的铭文文本(甚至可以标记出缺失文本的长度是已知的还是未知的)和图片时,Aeneas 会通过嵌入(embedding)将每一段铭文转换成一个独特的“历史指纹”。这个指纹不仅编码了文本的字面信息,还包含了其背后隐藏的语言模式、句法结构、历史背景和地理来源等深层信息。

随后,Aeneas 会在这个由海量”历史指纹“构成的多维空间中进行检索,找出与目标铭文最相关的平行文本,并按照相关性排序后呈现给研究人员。更重要的是,它还能根据上下文语境,提出填补缺失文字的多种可能性建议,并预测该铭文最有可能的制作年代和发源地(精确到罗马帝国的 62 个行省之一)。


(来源:Nature)

为了验证 Aeneas 的实际效果,研究团队进行了一项规模空前的“古代历史学家与人工智能”合作研究。他们邀请了 23 位从事铭文研究的专家,从硕士生到资深教授,参与了一场模拟真实研究工作流程的实验。在实验中,历史学家们首先独立完成对一批铭文的修复、断代和溯源工作。随后,他们会获得 Aeneas 提供的平行文本和预测建议,再进行一次同样的工作。

实验结果显示,在 Aeneas 的帮助下,历史学家的工作效率和准确性都得到了显著提升。在地理归属方面,历史学家独立工作的最高准确率(Top-1 accuracy)为 27%,而在结合了 Aeneas 的平行文本和预测后,这一数字飙升至 68.3%,提升了 152%。

在文本修复方面,以字符错误率(Character Error Rate, CER,该数值越低越好)来衡量,历史学家的独立错误率为 39.0%,而在 Aeneas 的辅助下,错误率降至 21.4%。在年代判断上,预测结果与真实年代范围的平均差距也从 31.3 年缩短至 14.1 年,接近 Aeneas 自身的 12.8 年。在 90% 的情况下,学者们认为 Aeneas 提供的平行文本是“有用的研究起点”,他们完成任务的信心也平均提升了 44%。


(来源:Nature)

一位参与测试的历史学家感叹道:“Aeneas 检索到的平行文本彻底改变了我对(目标)铭文的看法。如果没有它,我可能要花好几天时间才能找到这些材料,而现在只需要 15 分钟。这让我可以把更多时间用于撰写和构建研究问题,而不是在寻找资料上。”

研究团队还用两个代表性案例来展示 Aeneas 的强大能力。其中一个是罗马帝国第一位皇帝奥古斯都的“神圣奥古斯都事迹录”(Res Gestae Divi Augusti)。关于这篇长篇铭文的确切撰写时间,学术界一直存在争论。Aeneas 在分析了全文后,给出了两个可能的年代高峰,一个在公元前 10-1 年,另一个则在公元 10-20 年。这恰好与学术界两种主流假说高度吻合,证明 Aeneas 能够以量化的方式捕捉并呈现复杂的历史学辩论。


(来源:DeepMind)

另一个案例是一座在今天德国美因茨(古罗马时期称为 Mogontiacum)发现的还愿祭坛。Aeneas 在分析这座祭坛的铭文时,其首要推荐的平行文本是另一座在附近发现、年代稍早的祭坛。这两座祭坛共享着非常罕见的文本程式和圣像学特征,考古学家此前已提出后者可能直接影响了前者。Aeneas 在不知道任何考古背景或空间信息的情况下,仅通过文本分析就精准地识别出了这种微妙而关键的历史关联。索默斯切尔德博士形容这些发现是“令人瞠目结舌的时刻”。

当然,Aeneas 并非完美无缺,它也不是要取代历史学家。哈佛大学的古典学教授 Kathleen Coleman 就指出,目前还不完全清楚这个工具在历史学家的长期工作流程中会多大程度上发挥作用,而且它并不能推测文本的“意义”,最终的解释工作仍需人类专家来完成。研究论文本身也坦诚,模型的性能在数据稀疏的地区和时期会有所下降,并且存在因训练数据本身的局限性而产生偏见的风险。

但 Aeneas 的设计初衷也正是成为一个强大的协作者,而非替代者。它将学者从繁重、重复的资料搜寻工作中解放出来,让他们能更专注于批判性思考和历史解释。剑桥大学的著名古典学家 Mary Beard 教授评价说:“它有望带来变革。”牛津大学的古代史教授、论文的合著者 Jonathan Prag 也表示,这个工具让更广泛的人群能够参与到铭文研究中来,因为“如果没有这样的工具,你只能依靠积累海量的个人知识或拥有一个巨大的图书馆。”

Aeneas 的技术建立在其前身 Ithaca 之上,Ithaca 是一个专注于修复古希腊铭文的 AI 模型。现在,Ithaca 也将升级为由 Aeneas 的技术驱动,性能得到全面提升。为了让这项技术能惠及更多人,研究团队已经将 Aeneas 的代码和数据集开源,并建立了一个名为“预测过去”(predictingthepast.com)的互动网站,免费向所有研究人员、学生和教育工作者开放。他们还与比利时根特的教师培训项目合作,开发了一套教学大纲,旨在将 Aeneas 融入中学历史课堂,培养学生的数字素养和史料批判能力。

参考资料:

1.https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

2.https://www.nature.com/articles/s41586-025-09292-5

3.https://www.technologyreview.com/2025/07/23/1120574/deepmind-ai-aeneas-helps-historians-interpret-latin-inscriptions/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刺激!苹果突然官宣:1月8日,新品正式发售!

刺激!苹果突然官宣:1月8日,新品正式发售!

科技堡垒
2026-01-06 11:41:33
古怪的一野:打到最后彭总都怕镇不住,十万大军几乎成了“川军”

古怪的一野:打到最后彭总都怕镇不住,十万大军几乎成了“川军”

浩舞默画
2026-01-08 09:38:17
想不明白就是最大的问题

想不明白就是最大的问题

吴女士
2026-01-08 19:44:25
“要么听我的,要么滚蛋”,特朗普一口气狂退66个群,还有更多在排队

“要么听我的,要么滚蛋”,特朗普一口气狂退66个群,还有更多在排队

上观新闻
2026-01-08 14:20:19
钱交了、单锁了、承诺却没了? 极氪“食言”购置税兜底,数百车主怒斥“言而无信”

钱交了、单锁了、承诺却没了? 极氪“食言”购置税兜底,数百车主怒斥“言而无信”

新浪财经
2026-01-07 08:30:09
如果一个人还在穿10年前的衣服,那说明几个问题

如果一个人还在穿10年前的衣服,那说明几个问题

放牛娃的遐想
2026-01-07 08:16:47
日票房仅126万,离开了梁家辉,他却失去了票房号召力!

日票房仅126万,离开了梁家辉,他却失去了票房号召力!

糊咖娱乐
2026-01-07 18:36:51
中国干细胞治疗大突破!1.98万治愈多种绝症,医保也覆盖了?

中国干细胞治疗大突破!1.98万治愈多种绝症,医保也覆盖了?

Thurman在昆明
2026-01-07 01:48:56
里奇-保罗:就算东契奇防守提升到托尼-阿伦的水平,湖人也无法夺冠

里奇-保罗:就算东契奇防守提升到托尼-阿伦的水平,湖人也无法夺冠

懂球帝
2026-01-08 15:28:44
强大德军成片冻死在莫斯科时,为何不烧树木取暖?苏联人做法很绝

强大德军成片冻死在莫斯科时,为何不烧树木取暖?苏联人做法很绝

云霄纪史观
2026-01-06 01:56:08
火箭1分惜败直落西部第6!火蜜直言难受 队记:连输6支弱旅真有趣

火箭1分惜败直落西部第6!火蜜直言难受 队记:连输6支弱旅真有趣

颜小白的篮球梦
2026-01-08 14:11:06
超市结账,身后大妈把她车里的水果扔我这,让我一起结,我没说话

超市结账,身后大妈把她车里的水果扔我这,让我一起结,我没说话

娱乐圈的笔娱君
2026-01-08 11:48:53
一百万一夜?赖昌星揭露两人真实关系,歌唱家董文华为何会退圈?

一百万一夜?赖昌星揭露两人真实关系,歌唱家董文华为何会退圈?

蜉蝣说
2024-06-30 21:34:26
费迪南德谈梅西与C罗:若只踢一场比赛,我会选择C罗

费迪南德谈梅西与C罗:若只踢一场比赛,我会选择C罗

懂球帝
2026-01-08 06:50:47
国际乒联主席坐不住了!亚洲杯樊振东没参赛,莎莎球迷也开始观望

国际乒联主席坐不住了!亚洲杯樊振东没参赛,莎莎球迷也开始观望

查尔菲的笔记
2026-01-08 13:27:11
300八路军被2千伪军围困芦苇荡,17岁卫生员无意间一句话迎来转机

300八路军被2千伪军围困芦苇荡,17岁卫生员无意间一句话迎来转机

卡西莫多的故事
2025-12-22 09:50:12
天津一在建工地发生火情,通报来了...

天津一在建工地发生火情,通报来了...

全接触狐狐
2026-01-08 17:36:34
高峰也没想到,他当年抛弃的儿子,如今开始给那英争光了

高峰也没想到,他当年抛弃的儿子,如今开始给那英争光了

趣文说娱
2026-01-04 16:34:24
女子救助流浪狗带回家,3年后狗狗突然咬死全家,邻居报警真相曝光

女子救助流浪狗带回家,3年后狗狗突然咬死全家,邻居报警真相曝光

悬案解密档案
2025-08-25 11:11:53
国乒新教练组浮出水面!有四人留守疑似续约,许昕透露已知道结果

国乒新教练组浮出水面!有四人留守疑似续约,许昕透露已知道结果

三十年莱斯特城球迷
2026-01-07 22:39:36
2026-01-08 20:44:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16097文章数 514462关注度
往期回顾 全部

科技要闻

智谱拿下“全球大模型第一股”,凭什么

头条要闻

特朗普批准法案以阻止中国购买俄罗斯石油 外交部回应

头条要闻

特朗普批准法案以阻止中国购买俄罗斯石油 外交部回应

体育要闻

乒乓大白鹅:从摩尔多瓦地下室到世乒赛领奖台

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

数码
健康
艺术
公开课
军事航空

数码要闻

TRYX创氪星系水冷产品漏液包赔升级至全额赔付

这些新疗法,让化疗不再那么痛苦

艺术要闻

颐和园金光穿洞

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普提出将美国军费提升至1.5万亿美元

无障碍浏览 进入关怀版