网易首页 > 网易号 > 正文 申请入驻

谷歌开源AI工具Aeneas,辅助历史学家高精度修复、断代及溯源铭文

0
分享至

在博物馆幽暗的灯光下,一块残破的古罗马石碑静静地躺在展柜中。石碑上的拉丁文铭刻着早已逝去的时代信息,但岁月侵蚀和人为破坏让大部分文字变得模糊不清、难以辨认。对于历史学家和考古学家而言,解读这些被称为“历史最初手稿”的铭文,是一项极其重要却又无比艰辛的工作。现在,来自谷歌的 AI 或许能让这项工作变得轻松一些。

谷歌 DeepMind 与多所大学的历史学家合作,于 2025 年 7 月 23 日在《自然》(Nature)上发表了一项最新研究成果,推出了一款名为“埃涅阿斯”(Aeneas)的 AI 工具。这款以古罗马神话中特洛伊英雄命名的程序,旨在帮助研究人员解读、修复和考证那些饱经沧桑的古罗马拉丁文铭文。它不仅能以高准确率填补铭文中缺失的文字,还能推断出铭文的制作年代和地理来源。

古罗马人留下了海量的铭文,它们被刻在纪念碑、祭坛、墓碑、陶器甚至涂鸦墙上,内容包罗万象,从皇帝的法令、战争的记录,到商人的账本、情人的诗篇,为后世了解罗马世界的政治、经济、文化乃至普通人的日常生活提供了最直接、最鲜活的证据。与史官笔下的“胜利者书写的历史”不同,这些铭文是古罗马社会各阶层人士的真实心声。然而,解读它们的过程却相当困难。

这些铭文常常以碎片的形态被发现,或者文字因风化而变得模糊不清,许多关键信息就此丢失。学者们在研究时,需要依靠自身的知识和丰富的经验,在浩如烟海的文献资料库中寻找可供参照的“平行文本”(parallels)——即那些在措辞、句法、格式或出处上相似的其他铭文。通过对比分析,他们才能逐步拼凑出碎片化的信息,推断缺失部分的内容,并将其置于更广阔的历史背景中进行解读。这一过程不仅耗时耗力,而且高度依赖学者的个人专长和所能接触到的图书馆资源,往往会限制研究的广度和深度。

DeepMind 的研究员 Yannis Assael 和诺丁汉大学的历史学家 Thea Sommerschield 博士领导的团队开发的 Aeneas,正是为了解决这一难题。Aeneas 的核心能力并不是单纯的文本匹配,而是深度“语境化”(contextualizing)。其基于一个名为“拉丁文铭文数据集”(LED,Latin Epigraphic Dataset)的数据集训练而成,这是一个庞大的数据库,整合了来自罗马铭文数据库(EDR,Epigraphic Database Roma)、海德堡铭文数据库(EDH,Epigraphic Database Heidelberg)等多个权威来源的数据,包含了超过 17.6 万条拉丁文铭文,总字符数高达 1,600 万个。

基于这个庞大的数据集,Aeneas 采用了一种基于 Transformer 架构的深度神经网络。它不仅仅是分析铭文的文本内容,还能在某些情况下结合铭文的图片进行多模态分析(multimodal analysis)。当研究人员输入一段残缺的铭文文本(甚至可以标记出缺失文本的长度是已知的还是未知的)和图片时,Aeneas 会通过嵌入(embedding)将每一段铭文转换成一个独特的“历史指纹”。这个指纹不仅编码了文本的字面信息,还包含了其背后隐藏的语言模式、句法结构、历史背景和地理来源等深层信息。

随后,Aeneas 会在这个由海量”历史指纹“构成的多维空间中进行检索,找出与目标铭文最相关的平行文本,并按照相关性排序后呈现给研究人员。更重要的是,它还能根据上下文语境,提出填补缺失文字的多种可能性建议,并预测该铭文最有可能的制作年代和发源地(精确到罗马帝国的 62 个行省之一)。

为了验证 Aeneas 的实际效果,研究团队进行了一项规模空前的“古代历史学家与人工智能”合作研究。他们邀请了 23 位从事铭文研究的专家,从硕士生到资深教授,参与了一场模拟真实研究工作流程的实验。在实验中,历史学家们首先独立完成对一批铭文的修复、断代和溯源工作。随后,他们会获得 Aeneas 提供的平行文本和预测建议,再进行一次同样的工作。

实验结果显示,在 Aeneas 的帮助下,历史学家的工作效率和准确性都得到了显著提升。在地理归属方面,历史学家独立工作的最高准确率(Top-1 accuracy)为 27%,而在结合了 Aeneas 的平行文本和预测后,这一数字飙升至 68.3%,提升了 152%。

在文本修复方面,以字符错误率(Character Error Rate, CER,该数值越低越好)来衡量,历史学家的独立错误率为 39.0%,而在 Aeneas 的辅助下,错误率降至 21.4%。在年代判断上,预测结果与真实年代范围的平均差距也从 31.3 年缩短至 14.1 年,接近 Aeneas 自身的 12.8 年。在 90% 的情况下,学者们认为 Aeneas 提供的平行文本是“有用的研究起点”,他们完成任务的信心也平均提升了 44%。

一位参与测试的历史学家感叹道:“Aeneas 检索到的平行文本彻底改变了我对(目标)铭文的看法。如果没有它,我可能要花好几天时间才能找到这些材料,而现在只需要 15 分钟。这让我可以把更多时间用于撰写和构建研究问题,而不是在寻找资料上。”

研究团队还用两个代表性案例来展示 Aeneas 的强大能力。其中一个是罗马帝国第一位皇帝奥古斯都的“神圣奥古斯都事迹录”(Res Gestae Divi Augusti)。关于这篇长篇铭文的确切撰写时间,学术界一直存在争论。Aeneas 在分析了全文后,给出了两个可能的年代高峰,一个在公元前 10-1 年,另一个则在公元 10-20 年。这恰好与学术界两种主流假说高度吻合,证明 Aeneas 能够以量化的方式捕捉并呈现复杂的历史学辩论。

另一个案例是一座在今天德国美因茨(古罗马时期称为 Mogontiacum)发现的还愿祭坛。Aeneas 在分析这座祭坛的铭文时,其首要推荐的平行文本是另一座在附近发现、年代稍早的祭坛。这两座祭坛共享着非常罕见的文本程式和圣像学特征,考古学家此前已提出后者可能直接影响了前者。Aeneas 在不知道任何考古背景或空间信息的情况下,仅通过文本分析就精准地识别出了这种微妙而关键的历史关联。索默斯切尔德博士形容这些发现是“令人瞠目结舌的时刻”。

当然,Aeneas 并非完美无缺,它也不是要取代历史学家。哈佛大学的古典学教授 Kathleen Coleman 就指出,目前还不完全清楚这个工具在历史学家的长期工作流程中会多大程度上发挥作用,而且它并不能推测文本的“意义”,最终的解释工作仍需人类专家来完成。研究论文本身也坦诚,模型的性能在数据稀疏的地区和时期会有所下降,并且存在因训练数据本身的局限性而产生偏见的风险。

但 Aeneas 的设计初衷也正是成为一个强大的协作者,而非替代者。它将学者从繁重、重复的资料搜寻工作中解放出来,让他们能更专注于批判性思考和历史解释。剑桥大学的著名古典学家 Mary Beard 教授评价说:“它有望带来变革。”牛津大学的古代史教授、论文的合著者 Jonathan Prag 也表示,这个工具让更广泛的人群能够参与到铭文研究中来,因为“如果没有这样的工具,你只能依靠积累海量的个人知识或拥有一个巨大的图书馆。”

Aeneas 的技术建立在其前身 Ithaca 之上,Ithaca 是一个专注于修复古希腊铭文的 AI 模型。现在,Ithaca 也将升级为由 Aeneas 的技术驱动,性能得到全面提升。为了让这项技术能惠及更多人,研究团队已经将 Aeneas 的代码和数据集开源,并建立了一个名为“预测过去”(predictingthepast.com)的互动网站,免费向所有研究人员、学生和教育工作者开放。他们还与比利时根特的教师培训项目合作,开发了一套教学大纲,旨在将 Aeneas 融入中学历史课堂,培养学生的数字素养和史料批判能力。

参考资料:

1.https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

2.https://www.nature.com/articles/s41586-025-09292-5

3.https://www.technologyreview.com/2025/07/23/1120574/deepmind-ai-aeneas-helps-historians-interpret-latin-inscriptions/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
挪威捞出中国青花瓷,西方高调炫耀,归还二字只字不提

挪威捞出中国青花瓷,西方高调炫耀,归还二字只字不提

一口娱乐
2026-06-02 17:56:10
中日军方互批,日本调门升级,高市早苗在组建对华制衡统一阵线?

中日军方互批,日本调门升级,高市早苗在组建对华制衡统一阵线?

一曲一场談
2026-06-03 18:08:55
2027款宾利飞驰发布:回归单大灯设计,S版成系列史上最强车型

2027款宾利飞驰发布:回归单大灯设计,S版成系列史上最强车型

IT之家
2026-06-03 11:18:36
网红模仿黄仁勋十天涨粉好几万,直播日入上千,被英伟达警告

网红模仿黄仁勋十天涨粉好几万,直播日入上千,被英伟达警告

大眼妹妹
2026-06-03 14:52:14
小红书为什么需要男人?

小红书为什么需要男人?

钛媒体APP
2026-06-01 15:17:12
张艺谋4月身体出状况,陈婷摘掉妻子认证

张艺谋4月身体出状况,陈婷摘掉妻子认证

青杉依旧啊啊
2026-05-16 23:41:41
内塔尼亚胡:绝不允许伊朗威胁以色列的生存

内塔尼亚胡:绝不允许伊朗威胁以色列的生存

新华社
2026-06-02 23:29:05
皇马离队第3人敲定:29岁边缘人告别 7年15冠 转会费600万

皇马离队第3人敲定:29岁边缘人告别 7年15冠 转会费600万

叶青足球世界
2026-06-03 15:32:18
外卖大势已定?不出意外的话,明后年外卖行业将迎来3个变化

外卖大势已定?不出意外的话,明后年外卖行业将迎来3个变化

混沌录
2026-06-02 22:58:17
体检报告出现这几个字,距离癌症只有一步之遥!别等得癌了才后悔

体检报告出现这几个字,距离癌症只有一步之遥!别等得癌了才后悔

健康之光
2026-06-01 08:56:18
彻底炸锅!儿媳月子里喂奶,公公5次闯入房间,最终爆发家庭矛盾

彻底炸锅!儿媳月子里喂奶,公公5次闯入房间,最终爆发家庭矛盾

火山詩话
2026-06-02 10:33:01
56岁工地大爷坦言:跳了三个月交谊舞,才明白那些女人的真正意图

56岁工地大爷坦言:跳了三个月交谊舞,才明白那些女人的真正意图

施工员小天哥
2026-06-02 15:14:57
史诗级4队交易方案:火箭7换2组3巨头 绿军化整为零 鹈鹕躺平重建

史诗级4队交易方案:火箭7换2组3巨头 绿军化整为零 鹈鹕躺平重建

毒舌NBA
2026-06-03 16:01:04
长沙机场目前已恢复正常降落

长沙机场目前已恢复正常降落

潇湘晨报
2026-06-03 17:14:35
台儿庄战役伤亡争议八十年,日方档案还原真实战况

台儿庄战役伤亡争议八十年,日方档案还原真实战况

磊子讲史
2026-05-26 14:22:17
“不加一滴水”配料表首位竟是水!网友:“确实没加一滴,加了一桶!”

“不加一滴水”配料表首位竟是水!网友:“确实没加一滴,加了一桶!”

LOGO研究所
2026-06-03 09:12:07
土耳其站队了!正式向世界宣布:以色列若继续打加沙,会让他好看

土耳其站队了!正式向世界宣布:以色列若继续打加沙,会让他好看

傲傲讲历史
2026-05-31 09:18:17
《007:初露锋芒》邦女郎幕后演员揭晓

《007:初露锋芒》邦女郎幕后演员揭晓

山月不知2
2026-06-02 06:33:27
6月4日24时油价调整,今年“最大油价下跌”中,预计大跌超4毛/升

6月4日24时油价调整,今年“最大油价下跌”中,预计大跌超4毛/升

油价早知道
2026-06-03 09:24:31
每月工资“这个数”,你就偷偷乐吧,比90%的人都高了!

每月工资“这个数”,你就偷偷乐吧,比90%的人都高了!

CG说科技
2026-06-02 17:18:10
2026-06-03 18:51:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16788文章数 514995关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

网友花120万在直播间买原石 警方:30人拼单29个是托

头条要闻

网友花120万在直播间买原石 警方:30人拼单29个是托

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

游戏
本地
数码
公开课
军事航空

《漫威金刚狼》确认无收藏版!也没有追加计划

本地新闻

用杨柳青年画的方式,打开天津

数码要闻

618淘宝百亿补贴上线手机家电加补专场 空调价格降到千元大关

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊互袭波及多国 过去一夜中东局势骤然升级

无障碍浏览 进入关怀版