网易首页 > 网易号 > 正文 申请入驻

谷歌开源AI工具Aeneas,辅助历史学家高精度修复、断代及溯源铭文

0
分享至

在博物馆幽暗的灯光下,一块残破的古罗马石碑静静地躺在展柜中。石碑上的拉丁文铭刻着早已逝去的时代信息,但岁月侵蚀和人为破坏让大部分文字变得模糊不清、难以辨认。对于历史学家和考古学家而言,解读这些被称为“历史最初手稿”的铭文,是一项极其重要却又无比艰辛的工作。现在,来自谷歌的 AI 或许能让这项工作变得轻松一些。

谷歌 DeepMind 与多所大学的历史学家合作,于 2025 年 7 月 23 日在《自然》(Nature)上发表了一项最新研究成果,推出了一款名为“埃涅阿斯”(Aeneas)的 AI 工具。这款以古罗马神话中特洛伊英雄命名的程序,旨在帮助研究人员解读、修复和考证那些饱经沧桑的古罗马拉丁文铭文。它不仅能以高准确率填补铭文中缺失的文字,还能推断出铭文的制作年代和地理来源。


图丨相关论文(来源:Nature)

古罗马人留下了海量的铭文,它们被刻在纪念碑、祭坛、墓碑、陶器甚至涂鸦墙上,内容包罗万象,从皇帝的法令、战争的记录,到商人的账本、情人的诗篇,为后世了解罗马世界的政治、经济、文化乃至普通人的日常生活提供了最直接、最鲜活的证据。与史官笔下的“胜利者书写的历史”不同,这些铭文是古罗马社会各阶层人士的真实心声。然而,解读它们的过程却相当困难。


(来源:Nature)

这些铭文常常以碎片的形态被发现,或者文字因风化而变得模糊不清,许多关键信息就此丢失。学者们在研究时,需要依靠自身的知识和丰富的经验,在浩如烟海的文献资料库中寻找可供参照的“平行文本”(parallels)——即那些在措辞、句法、格式或出处上相似的其他铭文。通过对比分析,他们才能逐步拼凑出碎片化的信息,推断缺失部分的内容,并将其置于更广阔的历史背景中进行解读。这一过程不仅耗时耗力,而且高度依赖学者的个人专长和所能接触到的图书馆资源,往往会限制研究的广度和深度。

DeepMind 的研究员 Yannis Assael 和诺丁汉大学的历史学家 Thea Sommerschield 博士领导的团队开发的 Aeneas,正是为了解决这一难题。Aeneas 的核心能力并不是单纯的文本匹配,而是深度“语境化”(contextualizing)。其基于一个名为“拉丁文铭文数据集”(LED,Latin Epigraphic Dataset)的数据集训练而成,这是一个庞大的数据库,整合了来自罗马铭文数据库(EDR,Epigraphic Database Roma)、海德堡铭文数据库(EDH,Epigraphic Database Heidelberg)等多个权威来源的数据,包含了超过 17.6 万条拉丁文铭文,总字符数高达 1,600 万个。

基于这个庞大的数据集,Aeneas 采用了一种基于 Transformer 架构的深度神经网络。它不仅仅是分析铭文的文本内容,还能在某些情况下结合铭文的图片进行多模态分析(multimodal analysis)。当研究人员输入一段残缺的铭文文本(甚至可以标记出缺失文本的长度是已知的还是未知的)和图片时,Aeneas 会通过嵌入(embedding)将每一段铭文转换成一个独特的“历史指纹”。这个指纹不仅编码了文本的字面信息,还包含了其背后隐藏的语言模式、句法结构、历史背景和地理来源等深层信息。

随后,Aeneas 会在这个由海量”历史指纹“构成的多维空间中进行检索,找出与目标铭文最相关的平行文本,并按照相关性排序后呈现给研究人员。更重要的是,它还能根据上下文语境,提出填补缺失文字的多种可能性建议,并预测该铭文最有可能的制作年代和发源地(精确到罗马帝国的 62 个行省之一)。


(来源:Nature)

为了验证 Aeneas 的实际效果,研究团队进行了一项规模空前的“古代历史学家与人工智能”合作研究。他们邀请了 23 位从事铭文研究的专家,从硕士生到资深教授,参与了一场模拟真实研究工作流程的实验。在实验中,历史学家们首先独立完成对一批铭文的修复、断代和溯源工作。随后,他们会获得 Aeneas 提供的平行文本和预测建议,再进行一次同样的工作。

实验结果显示,在 Aeneas 的帮助下,历史学家的工作效率和准确性都得到了显著提升。在地理归属方面,历史学家独立工作的最高准确率(Top-1 accuracy)为 27%,而在结合了 Aeneas 的平行文本和预测后,这一数字飙升至 68.3%,提升了 152%。

在文本修复方面,以字符错误率(Character Error Rate, CER,该数值越低越好)来衡量,历史学家的独立错误率为 39.0%,而在 Aeneas 的辅助下,错误率降至 21.4%。在年代判断上,预测结果与真实年代范围的平均差距也从 31.3 年缩短至 14.1 年,接近 Aeneas 自身的 12.8 年。在 90% 的情况下,学者们认为 Aeneas 提供的平行文本是“有用的研究起点”,他们完成任务的信心也平均提升了 44%。


(来源:Nature)

一位参与测试的历史学家感叹道:“Aeneas 检索到的平行文本彻底改变了我对(目标)铭文的看法。如果没有它,我可能要花好几天时间才能找到这些材料,而现在只需要 15 分钟。这让我可以把更多时间用于撰写和构建研究问题,而不是在寻找资料上。”

研究团队还用两个代表性案例来展示 Aeneas 的强大能力。其中一个是罗马帝国第一位皇帝奥古斯都的“神圣奥古斯都事迹录”(Res Gestae Divi Augusti)。关于这篇长篇铭文的确切撰写时间,学术界一直存在争论。Aeneas 在分析了全文后,给出了两个可能的年代高峰,一个在公元前 10-1 年,另一个则在公元 10-20 年。这恰好与学术界两种主流假说高度吻合,证明 Aeneas 能够以量化的方式捕捉并呈现复杂的历史学辩论。


(来源:DeepMind)

另一个案例是一座在今天德国美因茨(古罗马时期称为 Mogontiacum)发现的还愿祭坛。Aeneas 在分析这座祭坛的铭文时,其首要推荐的平行文本是另一座在附近发现、年代稍早的祭坛。这两座祭坛共享着非常罕见的文本程式和圣像学特征,考古学家此前已提出后者可能直接影响了前者。Aeneas 在不知道任何考古背景或空间信息的情况下,仅通过文本分析就精准地识别出了这种微妙而关键的历史关联。索默斯切尔德博士形容这些发现是“令人瞠目结舌的时刻”。

当然,Aeneas 并非完美无缺,它也不是要取代历史学家。哈佛大学的古典学教授 Kathleen Coleman 就指出,目前还不完全清楚这个工具在历史学家的长期工作流程中会多大程度上发挥作用,而且它并不能推测文本的“意义”,最终的解释工作仍需人类专家来完成。研究论文本身也坦诚,模型的性能在数据稀疏的地区和时期会有所下降,并且存在因训练数据本身的局限性而产生偏见的风险。

但 Aeneas 的设计初衷也正是成为一个强大的协作者,而非替代者。它将学者从繁重、重复的资料搜寻工作中解放出来,让他们能更专注于批判性思考和历史解释。剑桥大学的著名古典学家 Mary Beard 教授评价说:“它有望带来变革。”牛津大学的古代史教授、论文的合著者 Jonathan Prag 也表示,这个工具让更广泛的人群能够参与到铭文研究中来,因为“如果没有这样的工具,你只能依靠积累海量的个人知识或拥有一个巨大的图书馆。”

Aeneas 的技术建立在其前身 Ithaca 之上,Ithaca 是一个专注于修复古希腊铭文的 AI 模型。现在,Ithaca 也将升级为由 Aeneas 的技术驱动,性能得到全面提升。为了让这项技术能惠及更多人,研究团队已经将 Aeneas 的代码和数据集开源,并建立了一个名为“预测过去”(predictingthepast.com)的互动网站,免费向所有研究人员、学生和教育工作者开放。他们还与比利时根特的教师培训项目合作,开发了一套教学大纲,旨在将 Aeneas 融入中学历史课堂,培养学生的数字素养和史料批判能力。

参考资料:

1.https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

2.https://www.nature.com/articles/s41586-025-09292-5

3.https://www.technologyreview.com/2025/07/23/1120574/deepmind-ai-aeneas-helps-historians-interpret-latin-inscriptions/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
色字头上一把刀!沈阳一男子追求00后女生“霸王硬上弓”,被判刑

色字头上一把刀!沈阳一男子追求00后女生“霸王硬上弓”,被判刑

火山詩话
2026-01-09 08:45:32
白宫“购岛”方案流出:向格陵兰人一次性付款,以说服他们脱离丹麦并可能加入美国,每人或得1万-10万美元

白宫“购岛”方案流出:向格陵兰人一次性付款,以说服他们脱离丹麦并可能加入美国,每人或得1万-10万美元

都市快报橙柿互动
2026-01-09 08:14:32
医生发现:经常吃猪油的人,心脏病风险要比不吃猪油的人更高?

医生发现:经常吃猪油的人,心脏病风险要比不吃猪油的人更高?

小胡军事爱好
2025-12-02 10:34:39
美橄榄球明星的隐私部位尺寸,被模特前妻公开讨论,怒而对簿公堂

美橄榄球明星的隐私部位尺寸,被模特前妻公开讨论,怒而对簿公堂

译言
2026-01-07 10:33:38
回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被低估的!

回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被低估的!

另子维爱读史
2026-01-09 21:09:05
北京200万内二手房火了!占成交近6成,刚需抄底性价比老区

北京200万内二手房火了!占成交近6成,刚需抄底性价比老区

右耳远闻
2026-01-07 18:35:02
希罗一家近照,亿元合同快到期,超模女友火辣,今年仍是巨星

希罗一家近照,亿元合同快到期,超模女友火辣,今年仍是巨星

篮球看比赛
2026-01-09 12:15:56
特朗普强硬表态,谁敢拦截对台军售就对谁开战,美国军工股暴涨

特朗普强硬表态,谁敢拦截对台军售就对谁开战,美国军工股暴涨

我心纵横天地间
2026-01-07 16:57:21
东航餐食过于简单遭吐槽?有乘客称“仅收到一包20克花生米”,最新回应

东航餐食过于简单遭吐槽?有乘客称“仅收到一包20克花生米”,最新回应

新浪财经
2026-01-08 21:41:09
山东一小学走标线列队入校,视频曝光后,全网吵翻了!

山东一小学走标线列队入校,视频曝光后,全网吵翻了!

眼光很亮
2026-01-09 01:11:52
2025年我国CPI与上年持平

2025年我国CPI与上年持平

新华社
2026-01-09 10:30:04
色谱:我身体的四重奏

色谱:我身体的四重奏

疾跑的小蜗牛
2026-01-09 20:10:12
小区楼上天天晚上都有女的大声叫。。。

小区楼上天天晚上都有女的大声叫。。。

微微热评
2025-12-24 00:26:04
我妈86岁,退休工资卡交给我管,她摔跤住院,嫂子说没见过钱没空伺候。我:卡里还80万,我等会问问我侄子

我妈86岁,退休工资卡交给我管,她摔跤住院,嫂子说没见过钱没空伺候。我:卡里还80万,我等会问问我侄子

上海约饭局
2026-01-09 16:53:31
松冈玲:从文职OL到“六边形战士”,这位姐的娱乐圈剧本有点野!

松冈玲:从文职OL到“六边形战士”,这位姐的娱乐圈剧本有点野!

碧波万览
2026-01-10 04:40:02
0.5毫克就致命!浙江哥俩双双中毒,医生:尚无特效解药

0.5毫克就致命!浙江哥俩双双中毒,医生:尚无特效解药

环球网资讯
2026-01-09 15:33:36
上海市市管干部任职前公示,徐惠丽拟任地区党委书记

上海市市管干部任职前公示,徐惠丽拟任地区党委书记

上观新闻
2026-01-09 19:22:06
终于轮到日本“强烈抗议”了:130年来,日本从未像今天这样憋屈

终于轮到日本“强烈抗议”了:130年来,日本从未像今天这样憋屈

胖哥不胡说
2026-01-08 13:12:20
2026年央视春晚彩排曝光后,评论区炸锅,赵本山的担心恐要成真了

2026年央视春晚彩排曝光后,评论区炸锅,赵本山的担心恐要成真了

小小李娱
2026-01-07 17:41:55
深夜英特尔狂飙超8%,中概股下挫,油价、白银拉升

深夜英特尔狂飙超8%,中概股下挫,油价、白银拉升

21世纪经济报道
2026-01-10 00:03:07
2026-01-10 05:23:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16103文章数 514466关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

丹麦专家:美军“拿下”格陵兰岛只要45分钟

头条要闻

丹麦专家:美军“拿下”格陵兰岛只要45分钟

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

关晓彤鹿晗风波后露面 不受影响状态佳

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

助跑三年的奇瑞 接下来是加速还是起跳?

态度原创

教育
家居
旅游
艺术
房产

教育要闻

教育爱打人的学生,老师不能惹祸上身啊!

家居要闻

木色留白 演绎现代自由

旅游要闻

想看雾凇别瞎跑!吉林阿什哈达这 5 个观赏秘诀,帮你避开空跑遗憾

艺术要闻

扑面而来的激情:俄罗斯画家斯拉因斯基 大笔触绘画作品!

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

无障碍浏览 进入关怀版