网易首页 > 网易号 > 正文 申请入驻

荣新江:关于敦煌文献的“数字化”问题

0
分享至

本文转自“中国敦煌吐鲁番学会”,原刊《敦煌研究》2024年第4期,第92-96页。如需引用,请核对原作。旨在知识分享,如有侵权,敬请联系小编删除。

敦煌藏经洞出土文献包括佛经、道书、四部典籍、公私文书等各类文献材料,其中典籍部分有些有文本传世,有些则是佚书,而公私文书则是独一无二的。敦煌文献主要产生于公元5世纪初至11世纪初,作为中国古代文献的一部分,有其特殊的意义,很多文献是现存历史文献中的孤本,是无法用其他文献替代的。

敦煌文献自1900年发现以来,大多数精品被斯坦因、伯希和、奥登堡等人劫往英、法、俄国,还有很多流散在国内外众多公私藏家手中。经过一百多年来学者和收藏机构的努力,目前大多数文献的图片已经发表,从缩微胶卷、黑白图版,到彩色图版和数字化图像,直到最近出版的高清彩色图录,如《法国国家图书馆藏敦煌文献》1、《甘肃藏敦煌文献》2、《中国国家图书馆藏敦煌文献》3,极大地推动了敦煌文献的整理与研究。

到目前为止,传世的中国古代典籍不少已经数字化,与敦煌文献对应的中古时代的四部书、佛典、道书,几乎都有可以检索的电子数据库,如《四库全书》数据库、CBETA(中华佛教典籍数据库)、《中华道藏》数据库等等,做到了所有文字都可以检索,极大地推动了中国古籍的整理、研究和中华文化的传播。

然而,到目前为止,敦煌文献的数字化情况并不乐观。我们就以收藏敦煌文献最为丰富的英国国家图书馆、法国国家图书馆、俄罗斯科学院东方文献研究所、中国国家图书馆这四大收藏单位的藏卷为例,目前虽然已有多家专门的敦煌文献的数据库或是加载了敦煌文献的数据库,如英国国家图书馆牵头并与中国国家图书馆等单位共建的IDP(国际敦煌项目)、法国国家图书馆的Gallica、中国国家图书馆的中华古籍资源库、敦煌研究院的藏经洞出土文献目录数据库、敦煌研究院敦煌文献研究所的敦煌遗书数据库,这些数据库基本上上传的都是图片,而且像拥有敦煌文献数量居于前列的英国国家图书馆、中国国家图书馆,由于种种原因,都还没有把大量敦煌汉文文献图片上传到数据库中,而俄罗斯科学院东方文献研究所的一万多号敦煌文献也还没有上传,甚至还没有做好图片的扫描工作。

虽然大多数敦煌数据库加载的彩色图片对于敦煌学研究给予了巨大的帮助,但都不是真正的“数字化”数据库,无法检索每一个敦煌文献上的词语,只有敦煌研究院敦煌文献研究所的敦煌遗书数据库加载了录文,但目前也只有1千多号的文字资料,与7万号的敦煌文献相距甚远。

因为没有数字化的敦煌文献,所以我们还不能像其他传世文献那样做全文数据处理,比如我们无法检索出敦煌文献中出现了多少次“张议潮”一名,我们也不能知道到底有多少件编号的《大般若波罗蜜多经》。这严重阻碍了敦煌文献的整理和敦煌学研究的发展。

那么,如何做到敦煌文献真正的“数字化”呢,这里结合我目前正在主编的《法国国家图书馆藏敦煌文献》高清彩色图录和《解题目录》的工作,略加探讨。

敦煌文献的数字化主要应当由四个部分构成,(1)图像,(2)题目,(3)数字化文本,(4)检索工具。

(1)图像方面,如上所述,法国国家图书馆的藏卷已经全部上网,英国国家图书馆和中国国家图书馆还有相当数量的没有上网,俄罗斯科学院东方文献研究所的藏卷更不容乐观。最近笔者参加敦煌研究院与英国国家图书馆共同举办的“流失海外敦煌文物国际学术研究会暨国际敦煌项目工作会议”得知,目前主要的困难在于没有经费,工作人员不够,所以上网的速度非常缓慢,这个问题似乎也无法在短期内解决。英国国家图书馆获得香港北山堂的资助,开始从事《妙法莲华经》的修复,为该经图片的上传IDP做准备。这样就某一部经来设计工作方案,不是一种学术的做法,只能对某个专题的研究有帮助,而敦煌学发展到现在,已经到了综合研究敦煌文献的时代;敦煌数据库的建设也应当从整体上全面处理文本,并把敦煌文献数据纳入到整个中国古代文献数据库的大家庭当中。因此,各个收藏单位还需要大力开源,争取更多的资金,把敦煌文献的图像早日上传。如果要分出上传文献的先后,应当由馆藏单位广泛征求学术界的意见,选择优先上传的文献,而不是只选择某一部普通的佛经来做先期工作。

(2)标目方面,经过各国敦煌学者、收藏单位的专家、修复技术人员的多年努力,目前海内外敦煌文献的编目、缀合等方面,都取得了长足的进步。中国国家图书馆的藏卷编目随着《国家图书馆藏敦煌遗书》的出版而基本完成,即每册后面所附的条记目录,这个目录也单独出版4。法国国家图书馆的藏卷目录都已发表5,其中原本没有以纸本形式出版的第二卷,也随着Gallica和IDP的图版在网上发表出来,极便学人使用。英国国家图书馆的目录原本有翟林奈(L. Giles)的《英国博物馆藏敦煌写本注记目录》6和刘铭恕的《斯坦因劫经录》7,随后又有黄永武《敦煌遗书最新目录》8,非佛经部分则有《英藏敦煌文献》图录的标题9、拙编《英国图书馆藏敦煌汉文非佛教文献残卷目录》10,以及郝春文等编著的《英藏敦煌社会历史文献释录》的重新标目11,这些都对英藏文献编目有很大推进,目前只有S.8400后的佛典还没有出版专门的目录。俄藏卷现有孟列夫主编的两卷本《苏联科学院亚洲民族研究所藏敦煌汉文写本注记目录》12,上海古籍出版社出版《俄藏敦煌文献》时也做了一部分新标目13,邰惠莉主编了俄藏全部写卷的目录14。

敦煌文献是写本时代的书籍,还有大量的公私文书,数量庞大,分散收藏,所以目前的各家目录以及研究者的论著中,对同一种文献有不同的命名。由于大多数写本留存的是卷尾的简称,而卷首的全称常常因纸张脱落而不存,所以许多目录都采用卷尾的简称,其实大多数文献都可以据其他写卷或传世的相关目录复原其全称。而公私文书经过多年来学界对吐鲁番出土文书的整理,已经形成一套按照唐朝官文书“抄目”的方式来标目的做法。也就是说,在上网之前,敦煌文献的标目应当有一个统一体例、进行“标准化”定名的过程。目前我们进行的《法国国家图书馆藏敦煌文献》,就是按照这样的原则对法藏敦煌文献全部做了统一、标准化地重新标目,这为今后的文献检索会提供很大的方便。但是,学者们对敦煌文献性质、名称的看法不会统一,所以今后仍然会有同一种文献有不同名称的现象,这种争论可以用多名并存的方式解决,因为网络上有足够的空间,不要因为名称不同的争论而耽误数据库建设的速度。

(3)电子化的文本,这是敦煌文献数字化的核心部分,也是最有学术含量和最难做的部分。正是因为有一定的难度,所以目前的敦煌文献数据库基本上都没有这一部分。不过我对这项工作表示十分乐观的态度,这也是我最近主持《法国国家图书馆藏敦煌文献》,随图录编纂《解题目录》时的感受。

经过一百多年来敦煌文献的整理研究,其实我们现在已经拥有绝大多数敦煌文献的整理本,从最早中日学者关注的儒家经典,到张涌泉主编的《敦煌经部文献合集》15,经部文献基本已经都有了录文。其他史部、子部文献也有不少分类整理的著作,像《刘子》16、《春秋后语》17、各种书仪18、类书19等,都有整理本20。医药文献也有数家整理本,天文历法文献都有较好的录文21,近年来各种数术文献有了分类整理22,最后有关长龙辑校《敦煌本数术文献辑校》的集成著作23。集部的《文选》有很好的合集24,其他诗歌、曲子词、碑铭赞也有透彻的整理,如《王梵志诗集》25、《敦煌诗集残卷辑考》26、《敦煌歌辞总编》27、《敦煌碑铭赞辑释》28。俗文学作品如讲经文、变文等更是敦煌文学研究者关注的对象,有《敦煌变文校注》29。藏外佛教文献中的古逸经、疑伪经30、三阶教文献、禅宗文献都有许多整理本。道教文献也有《敦煌道教文献合集》,已出版第1-2册31。

大量没有录文的普通藏内佛教典籍,可以借助已有的CBETA数据库,将其中的文本与敦煌本校对,经过修订、增补或删节,形成敦煌本。有些从事敦煌数字化的工作者提出用OCR来识别《法华经》文本,在我看来完全没有必要。因为《法华经》在CBETA上有非常好的文本,而日本学者兜木正亨编有《斯坦因·伯希和搜集敦煌法华经目录》32,还据日本唐招提寺所藏春日版《法华经》编成《敦煌目录对照·定本法华经》一书,所以没有必要重新扫描认证,就可以获得最好的《法华经》敦煌文本,并按照编号的残存程度,剪切成对应图版的电子文本。

对于公私文书的录文,学界也有大量的成果。计帐、户籍、差科簿及相关文书的精准录文见池田温《中国古代籍帐研究》33。各种公私文书,特别是大量寺院的算会历、入破历、行政文书,有唐耕耦等编《敦煌社会经济文献真迹释录》一至五辑34,唐耕耦还对寺院会计文书做了专门的缀合、复原工作35。律、令、格、式、判等法制文书有刘俊文《敦煌吐鲁番唐代法制文书考释》36;社文书有宁可、郝春文《敦煌社邑文书辑校》37;契约有沙知《敦煌契约文书辑校》38;几乎各类文书都有人整理校录。

目前只有郝春文教授主持的《英藏敦煌社会历史文献释录》,是完全对应着英藏敦煌非佛经文献做录文的,这是最方便的按编号顺序的上网文本。但大量的佛经没有收入。目前这套书进行到第19卷,编号至S.4433背,距离全部完成斯坦因收集品部分还有相当长的时间。因此,敦煌文献的数字化也不能等待“对号入座”的录文本完成之后再做数字化,而应当像上面所说,收集前人的录文成果,对应到相关的编号中去。

上面不是要做敦煌文献整理的系统总结,所以只是要说,绝大多数敦煌文献都已经有了整理的文本甚至是电子化的文本,这是我们在整理《法国国家图书馆藏敦煌文献解题目录》时获得的认知。不过收集相关的文本并加以整理的工作,不是敦煌数字化专家所能承担的,而是敦煌学研究者的职责和任务,只有敦煌学研究者知道哪个录文是最佳录文,哪家录文是值得信赖的录文。所以,敦煌学研究者和数字化专家的合作,才能产生真正数字化的敦煌文献数据库。

(4)检索功能,这也需要敦煌学研究者和数字化专家合作,前者提出研究的要求和指向,后者设计出各种检索功能,其结果必然对敦煌学有极大的推动作用。

最后应当提到的是,敦煌文献数据库的建设和完善,需要国际同行的通力合作,需要敦煌学者和数字化学者的相互结合,才能搭建好这个真正数字化的平台。同时应当指出,敦煌文献的录文大多数是中国学者整理完成的,因此在今后的敦煌文献数据库的建设中,中国学者理应做出自己的贡献,把自己的成果转化成数字化的敦煌文献,在扩大自己学术影响力的同时,也使数字化的敦煌文献成为更大范围的中国古代数字文献的一个组成部分。

1 荣新江主编《法国国家图书馆藏敦煌文献》1-60册,上海:上海古籍出版社,2023年

2敦煌研究院编,赵声良、苏伯民主编《甘肃藏敦煌文献》1-10册,兰州:甘肃教育出版社,2023年。

3中国国家图书馆编《中国国家图书馆藏敦煌文献》1-30册,北京:国家图书馆出版社,2023年。

4方广锠、李际宁、黄霞编《中国国家图书馆藏敦煌遗书总目录·馆藏目录卷》,北京:中国人民大学出版社,2016年。

5J.Gernet et Wu Chiyu, Catalogue des manuscrits chinois de Touen-houang. Fonds Pelliot chinois de la Bibliothèque nationale, I, Paris: Bibliothèque nationale, 1970; M. Soymié, Catalogue des manuscrits chinois de Touen-houang. Fonds Pelliot chinois de la Bibliothèque nationale, III, IV, V, Paris: Fondation Singer-Polignac et École française d’Extrême-Orient, 1983, 1991, 1995; F. Wang-Toutain, Catalogue des manuscrits chinois de Touen-houang, VI: Fragments chinois du Fonds Pelliot tibétain de la Bibliothèque nationale de France, Paris: École française d’Extrême-Orient, 2001.

6L. Giles, Descriptive catalogue of the Chinese manuscripts from Tunhuang in the British Museum, London, 1957.

7收入商务印书馆编《敦煌遗书总目索引》,北京:商务印书馆,1962年。

8黄永武编《敦煌遗书最新目录》,台北:新文丰出版公司,1986年。

9英国图书馆、中国敦煌吐鲁番学会敦煌古文献编辑委员会、中国社会科学院历史研究所、伦敦大学亚非学院合编《英藏敦煌文献(汉文佛经以外部分)》,成都:四川人民出版社,1990-1995年。

10荣新江《英国图书馆藏敦煌汉文非佛教文献残卷目录(S.6981-13624)》,台北:新文丰出版公司出版,1994年。

11郝春文主编《英藏敦煌社会历史文献释录》,北京:科学出版社,第1卷,2001年;第1卷修订版,北京:社会科学文献出版社,2018年;第2-19卷,北京:社会科学文献出版社,2003-2023年。

12孟列夫(Л. Н. Меньшиков)主编《苏联科学院亚洲民族研究所藏敦煌汉文写本注记目录》,上海:上海古籍出版社,1999年。

13圣彼得堡东方学研究所、上海古籍出版社合编《俄藏敦煌文献》第1-17册,上海:上海古籍出版社,1992-2001年。

14邰惠莉主编《俄藏敦煌文献叙录》,兰州:甘肃教育出版社,2019年。

15张涌泉主编、审订,许建平、关长龙、张涌泉等撰《敦煌经部文献合集》,北京:中华书局,2008年。

16林其锬《刘子集校合编》,上海:华东师范大学出版社,2012年。

17王恒杰编校《春秋后语辑考》,济南:齐鲁书社,1993年。

18赵和平《敦煌写本书仪研究》,台北:新文丰出版公司,1993年;赵和平《敦煌表状笺启书仪辑校》,南京:江苏古籍出版社,1997年。

19王三庆编著《敦煌类书》,高雄:丽文公司,1993年。

20马继兴、王淑民、陶广正、樊飞伦《敦煌医药文献辑校》,南京:江苏古籍出版社,1998年;马继兴主编《中国出土古医书考释与研究》,全3册,上海:上海科学技术出版社,2015年;沈澍农主编《敦煌吐鲁番医药文献新辑校》,北京:高等教育出版社,2016年。

21邓文宽《敦煌天文历法文献辑校》,南京:江苏古籍出版社,1996年。

22郑炳林《敦煌写本解梦书校録研究》,北京:民族出版社,2005年;郑炳林、王晶波《敦煌写本相书校録研究》,北京:民族出版社,2004年;陈于柱《敦煌写本宅经校録研究》,北京:民族出版社,2007年;陈于柱《区域社会史视野下的敦煌禄命书研究》,北京:民族出版社,2012年;陈于柱《敦煌吐鲁番出土发病书整理研究》,北京:科学出版社,2016年;王祥伟《敦煌五兆卜法文献校録研究》,北京:民族出版社,2011年。

23关长龙辑校《敦煌本数术文献辑校》,北京:中华书局,2019年。

24金少华《敦煌吐鲁番本〈文选〉辑校》,杭州:浙江大学出版社,2017年。

25项楚《王梵志诗校注》(修订本)上下册,北京:中华书局,2019年。

26徐俊纂辑《敦煌诗集残卷辑考》,北京:中华书局,2000年。

27任中敏《敦煌歌辞总编》上中下册,何剑平、张长彬校理,南京:凤凰出版社,2014年。

28郑炳林、郑怡楠《敦煌碑铭赞辑释(增订本)》上中下,上海:上海古籍出版社,2019年。

29 张涌泉、黄征《敦煌变文校注》,北京:中华书局,1997年。

30于淑健、黄征《敦煌本古佚与疑伪经校注》,全8册,南京:凤凰出版社,2017年。

31王卡主编《敦煌道教文献合集》第1-2册,北京:社会科学文献出版社,2020年。

32兜木正亨《スタイン·ペリオ搜集敦煌法华経目録》,东京:灵友会图书馆,1978年。

33 池田温《中国古代籍帐研究》,东京:东京大学出版会,1979年。

34唐耕耦等编《敦煌社会经济文献真迹释录》一至五辑,北京:书目文献出版社与全国图书数据缩微复制中心,1986-1990年。

35唐耕耦《敦煌寺院会计文书研究》,台北:新文丰出版公司,1997年。

36刘俊文《敦煌吐鲁番唐代法制文书考释》,北京:中华书局,1989年。

37宁可、郝春文《敦煌社邑文书辑校》,南京:江苏古籍出版社,1997年。

38沙知《敦煌契约文书辑校》,南京:江苏古籍出版社,1998年。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一输再输,热刺上赛季以来各项赛事输掉45场,为五大联赛最多

一输再输,热刺上赛季以来各项赛事输掉45场,为五大联赛最多

懂球帝
2026-03-11 17:20:06
大陆助74名台胞撤离中东,经沪返台,台陆委会急了,但立马被打脸

大陆助74名台胞撤离中东,经沪返台,台陆委会急了,但立马被打脸

DS北风
2026-03-10 18:18:04
财政压力的下半场:退休人员占比近四成,才是硬账

财政压力的下半场:退休人员占比近四成,才是硬账

超先声
2026-01-09 16:45:39
NBA内部人士认为,斯蒂芬·库里预计今夏将有另一位球星加盟勇士

NBA内部人士认为,斯蒂芬·库里预计今夏将有另一位球星加盟勇士

好火子
2026-03-11 01:47:43
白崇禧遭地痞无赖勒索,对方开口要100两黄金,白大笑:照给

白崇禧遭地痞无赖勒索,对方开口要100两黄金,白大笑:照给

新一说史
2026-03-10 19:06:22
瓜迪奥拉难了 曼城未来7场是魔鬼赛程:踢2次皇马+阿森纳+红蓝军

瓜迪奥拉难了 曼城未来7场是魔鬼赛程:踢2次皇马+阿森纳+红蓝军

智道足球
2026-03-10 20:40:12
陕西女孩相亲被约挖野菜后续:对方将野菜全拿走,只说我妈蒸得香

陕西女孩相亲被约挖野菜后续:对方将野菜全拿走,只说我妈蒸得香

周哥一影视
2026-03-10 18:38:34
大脚击中海鸥的门将:当时感觉糟透了,但救活它让我们很欣慰

大脚击中海鸥的门将:当时感觉糟透了,但救活它让我们很欣慰

懂球帝
2026-03-10 17:34:28
原来有的人是真的凭实力单身的!网友:竟然还要钱,竟然还是500

原来有的人是真的凭实力单身的!网友:竟然还要钱,竟然还是500

另子维爱读史
2026-02-15 20:20:55
女子补牙被磨错牙,维权后疑遭医院拒诊,系统标注“有精神病史”

女子补牙被磨错牙,维权后疑遭医院拒诊,系统标注“有精神病史”

观威海
2026-03-11 15:19:01
openclaw,果断卸载!这哪里是你的24O小时工作助理啊

openclaw,果断卸载!这哪里是你的24O小时工作助理啊

岁月有情1314
2026-03-11 05:51:47
马刺17战16胜剑指联盟第一!夺冠赔率已升第三 文班亚马逆袭MVP?

马刺17战16胜剑指联盟第一!夺冠赔率已升第三 文班亚马逆袭MVP?

颜小白的篮球梦
2026-03-11 11:13:46
大四女生曝出:宿舍已没人考研!2026大学生,算清了人生这笔账

大四女生曝出:宿舍已没人考研!2026大学生,算清了人生这笔账

行者聊官
2026-03-10 12:32:12
亚洲杯8强出炉!2个强队爆冷回家,中国女足对手已定,夺冠希望大

亚洲杯8强出炉!2个强队爆冷回家,中国女足对手已定,夺冠希望大

米果说识
2026-03-11 12:30:14
教师将过剩633.7万人,编制红利迅速消退

教师将过剩633.7万人,编制红利迅速消退

黯泉
2026-03-07 20:32:18
93年北京首次申奥失利,邓小平第一反应:有人捣鬼,伟人远见卓识

93年北京首次申奥失利,邓小平第一反应:有人捣鬼,伟人远见卓识

海佑讲史
2026-03-11 11:55:15
文旅部部长:外国游客来华都说“你好”不再用“Hello”,喝开水吃火锅成体验中国生活标配

文旅部部长:外国游客来华都说“你好”不再用“Hello”,喝开水吃火锅成体验中国生活标配

极目新闻
2026-03-07 12:57:58
怎么判断一个单位已经烂透了?网友:我公司全中,属实扎心

怎么判断一个单位已经烂透了?网友:我公司全中,属实扎心

另子维爱读史
2026-01-01 23:40:47
2026年医保巨变,挂号少做这一步,每年几千块医保全白交

2026年医保巨变,挂号少做这一步,每年几千块医保全白交

老特有话说
2026-03-10 15:30:08
广东4名儿童横躺马路,路过司机以为是塑料袋,发现不对劲后紧急刹车!官方最新通报

广东4名儿童横躺马路,路过司机以为是塑料袋,发现不对劲后紧急刹车!官方最新通报

东莞纪实
2026-03-10 18:22:32
2026-03-11 17:39:00
尚曦读史 incentive-icons
尚曦读史
读书、思考、文化、史学,本号主要推送近现代史领域文、史、哲、政、法等方面优秀文章。
30132文章数 12757关注度
往期回顾 全部

艺术要闻

这组剪纸太美了!

头条要闻

媒体:若中国没自己的"北斗" 战事来临时后果不堪设想

头条要闻

媒体:若中国没自己的"北斗" 战事来临时后果不堪设想

体育要闻

郭艾伦重伤,CBA下半赛季还能期待些什么

娱乐要闻

杨幂连续五年为刘诗诗庆生,刘诗诗回应

财经要闻

唤醒10万亿存量资金 公积金改革大潮来了

科技要闻

腾讯急了急了,微信绝密AI智能体首度曝光

汽车要闻

莲花纠偏, 冯擎峰的“收”与“守”

态度原创

数码
房产
健康
家居
教育

数码要闻

灵耀16 Air 2026锐龙版评测:全能屏低功耗长续航的“办公利器”

房产要闻

最低杀到7800元/㎡!海口2026第一波房价大调整来了!

转头就晕的耳石症,能开车上班吗?

家居要闻

中式风格 人间朝与暮

教育要闻

“父母要做孩子的容器”,男子分享:好的父母要能接得住孩子,要让孩子的情绪能在家里发泄

无障碍浏览 进入关怀版