杜甫究竟多大学问?——杜诗用字量研究的学术回顾与再讨论
一个作家的用字量和他的学问是成正比的,当然这只是我们在一定的范围之内才能得出的结论,比如说,一个诗人就流传下了十首诗,他的总共的用字量不到1000,那你说他不重复用字量有多少呢? 不就几百个字吗?那说他就没学问了?不是这个道理,我们从杜甫一生留下1400多首诗的这个数量来看,杜甫用字量还是比较可靠的代表了他阅读量的,也是能够看出杜甫学问的厉害之处的。要不然杜甫自己怎么会说“读书破万卷下笔如有神”呢?那么,杜甫一生的文学用字量到底有多少呢?学者的讨论不尽一致,下面我向大家汇报一下杜甫文学创作总用字量和不重复用字量的学术研究:
白川静在《汉字百话》中提供了一项令人震撼的统计数据:杜甫诗约1500首,总字数约5万字,不重复用字量高达4350字。这一数字,超过了《论语》的1355字、《孟子》的1889字、《诗经》的2839字,也超过了《史记》的4832字——一部58万字的巨著,也不过如此。与之对照,李白诗994首、约7.7万字,不重复用字量为3560字。两位诗坛巨匠的用字量,竟相差近800字。
![]()
这一悬殊,向所有研究者提出了一个根本性的问题:杜甫的语言广度,为何远超李白?这800字的差距,究竟意味着什么?
一、用字量的计量与疑云
白川静的统计结果,勾勒出一幅清晰的“用字量图谱”。纵观历代经典,不重复用字量普遍不高:《论语》1355字,《孟子》1889字,《诗经》2839字,《老子》仅802字。这些经书,虽然总字数数万,却仅以一两千个常用字构成。在此背景下,杜甫诗4350字的数据显得尤为突出——它不仅在唐代诗人中名列前茅,而且直追《文选》约7000字的用字量。白居易以186000字的总篇幅将用字量推至4600字,韩愈诗约400首,用字量与杜甫持平,同为4350字。
然而,这组数据一经摆出,疑点便随之浮现:杜甫与韩愈用字量同为4350字,是巧合还是统计口径所致?李白994首用字3560字,杜甫1500首用字4350字,李白诗总量约7.7万字,杜诗约5万字——以更少的篇幅动用更多的单字,这本身就暗示着杜甫语言资源的调用更为密集。
最关键的是,杜甫4350字与李白3560字之间约800字的差距,究竟从何而来?在考察了大量研究资料后,我们判断:这一差异主要源于统计口径,而非真实的用字差距。异体字、通假字、版本异文的总数不会超过一百,合理的统计差异应在150字左右。因此,杜诗用字量约4350字,李诗约3560字,二者实际差距可能在150-200字之间,而非表面显示的800字。白川静的统计提供了一个可靠的参照系,但不应对表面的数字差异作过度解读。
![]()
二、学问的纵深:用典与读书
比用字量更能说明问题的,是杜甫对知识的调用能力。读书越广博,用典就越丰富,杜甫正是这一逻辑的绝佳范例。据相关研究统计,杜诗用典所涉及的古籍书目多达140余种,典源主要出自唐以前的史书,兼及先秦诸子和其他古代典籍。史书中出典列前三位的分别是:《史记》335条次,《汉书》256条次,《后汉书》196条次。在先秦诸子中,《庄子》出典最多,达120条次。
在杜甫的1400余首诗章中,含有典故的诗多达775首,凡用典2312条次。这意味着,半数以上的杜诗都包含典故,平均每首诗动用约1.6个典故。这些典故不是生硬镶嵌,而是与诗境深度融合,成为语言有机体的一部分。杜甫曾对儿子宗武说“觅句新知律,摊书解满床”,儿子开始学诗时,为查找字句出处将书籍摊满一床。这一生活细节,折射出杜家读书、写诗、用典一脉相承的治学态度。
读书越广,用典越丰;用典越丰,语言的表现力就越强。杜诗的“沉郁顿挫”,并非仅来自情感的浓度,更来自知识储备的厚度。“读书破万卷,下笔如有神”——这既是自述,也是方法论。
三、语言的炼金术:从“字量”到“质量”
4350字是一个惊人的数字,但它仅仅反映了杜诗语言的一个侧面。真正让杜甫成为“诗圣”的,不是字量的堆砌,而是他对语言的锤炼。
叠字的使用,是一个极佳的观察窗口。杜诗有叠字627例,远超同时代诗人:李白331例,王维101例,孟浩然仅51例。杜诗的叠字数量,几乎是李白的2倍。这不是偶然。叠字是增强诗歌节奏感和情感浓度的利器,“无边落木萧萧下,不尽长江滚滚来”中“萧萧”“滚滚”的运用,使秋意与江势融为一体,产生了不可复制的声韵效果。
![]()
数字的运用,同样体现杜诗的用字特色。“一”字在杜诗中出现了461次,有398首诗使用了“一”字。无论是“一览众山小”的雄阔,还是“一岁四行役”的艰辛,杜甫都能将这个最简单的数字,赋予丰富而精准的内涵。正是这种对每个字的精心推敲,使杜诗达到了“语不惊人死不休”的境界。
四、语料库研究的新视野
近年来,大数据与语料库方法的引入,为杜诗语言研究提供了新的工具。香港城市大学揭春雨、孟瑩瑩的研究,以李杜诗歌文本中的字频差为切入点,从自然时空、人文社会、动植物、生理与动作、心理与感受、光颜色温度六个维度,对两位诗人的用字偏好进行了系统对比,以具体数据解释了李白飘逸豪放、杜甫沉郁顿挫的风格根由。这种方法将传统文学批评的“印象”转化为可测量的“数据”,为杜诗研究开辟了新的路径。
不过,语料库方法也面临挑战:它善于回答“是什么”(杜甫用了哪些字、频率如何),却难以回答“为什么”(这些字为何产生如此效果)。数字可以告诉读者杜甫用了多少叠字,但无法告诉读者“萧萧”“滚滚”为何比“飒飒”“滔滔”更动人。语言学分析必须与文学批评相结合,才能触及杜诗语言的根本。
五、学问的宽度与深度
回到最初的问题:杜甫究竟多大学问?用字量4350字,用典涉及古籍140余种,叠字627例,“一”字461次——这些数字勾勒出一个轮廓,但并非全貌。真正使杜甫成为“诗圣”的,不是他认识了多少字,而是他如何将这些字、这些典故、这些知识转化为独一无二的诗学语言。
用字量是广度,用典是深度,叠字是韵律感,“一”字是精微处见功夫。四者合一,才是“读书破万卷,下笔如有神”的全部含义。正如白川静的统计数据所揭示的那样,杜诗用字量4350字——这一数字的精确性固然可以继续讨论,但它所指向的杜甫学问之广、造诣之深,是无需质疑的。数字可以被修正,但杜甫作为中国文学史上语言大师的地位,不会因统计口径的调整而有丝毫动摇。
说到底,杜甫的学问,不在字库的大小,而在字字千钧的力量。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.