网易首页 > 网易号 > 正文 申请入驻

国产大模型为史学研究带来新机遇

0
分享至


国产大模型的快速迭代为人文社会科学研究注入强劲动能。在历史学领域,国产大模型有效降低了历史学者学习、掌握数智方法的技术门槛,这场技术革新不仅重构了史料处理、研究分析的底层逻辑,也为历史研究在范式创新、话语自主等方面带来新的发展机遇。国内多所高校纷纷投身这场技术浪潮,开始尝试自主布局新型数智研究平台,在技术与人文的平衡中探索史学研究的新可能。

数字史学进入“后大模型”时代

国产大模型对史学研究的改变,贯穿于史料整理、检索分析、成果呈现等多个环节,不仅显著提升了研究效率,还在重塑着研究的底层逻辑与实现路径,呈现出多点突破、深度赋能的鲜明特征。



长期以来,史料整理占据了文史学者大量时间,成为制约研究进展的重要瓶颈。国产大模型的介入,正在根本改变这一现状。北京大学图书馆研究馆员朱本军表示,随着大模型引入史学研究,文本文献OCR识别、访谈录音整理、文言文自动标点等工作的“效率提升了200倍不止”。这种飞跃使学者得以从繁琐劳动中解放出来,将更多精力投入学术问题本身,这本身就是一种改变。

技术门槛的降低更让数字史学实现普及化发展。南京大学历史学院教授王涛坦言,此前数字史学因需要计算机技术和编程基础,存在明显准入壁垒,而深度求索(DeepSeek)、Kimi、通义千问等国产大模型的升级迭代,让非技术背景的历史学者也能开展量化分析。学者通过发掘大模型的工具属性,可在文献翻译、多模态史料运用等方面“以技术换积累”,快速掌握陌生领域的核心概貌,极大拓展了研究的可能性。

在平台建设层面,数字史学正从传统的数据库仓储向智能研究平台转型,呈现出鲜明的两极分化。朱本军将传统模式概括为“前大模型”思路,即聚焦单一专题的资料堆砌与静态检索;而“后大模型”的发展思路则更注重全面的史料整合,通过借助大模型的自然语言理解、复杂推理等能力,提供检索增强生成、智能分析等个性化功能,实现从静态检索到知识生成的跨越。

南开大学历史学院副教授马思宇表示,大模型的突破本质上是实现了技术工具与史学研究逻辑的深度适配,它不再是传统数据库的技术升级,而是重构了史学研究从史料获取到分析解读的底层流程,“标志着数字史学从技术尝试进入体系化应用的新阶段”。

成果呈现与传播形态的创新同样亮眼。以往史学成果多局限于论文、专著,如今在大模型助力下,多模态发布成为可能。浙江大学文学院教授徐永明表示,当前大模型在开展专业历史科普、创意视频传播等方面表现不俗。他所在团队研发的云四库智能问答系统,涵盖多种地方志及多领域文献,确保专业数据可查可追溯;团队还以经典古籍为素材,利用大模型生成动画视频,无需专业编剧和导演即可完成科普内容创作。“这种低成本、高效率的传播方式,对普及中华优秀传统文化意义重大。”徐永明表示。

技术演进与学术发展内在契合

国产大模型与数字史学的深度融合,并非偶然的技术叠加,而是国家政策引导、技术自主创新与学科发展需求三重因素共振的结果,彰显出技术演进与学术发展的内在契合。

国家政策的顶层设计为技术发展筑牢根基。2025年8月,国务院印发《关于深入实施“人工智能+”行动的意见》,为国产人工智能发展提供引领性框架。在政策推动下,国产大模型技术加速迭代,技术革新有效降低了训练成本,开源生态的持续繁荣也为数字史学应用提供了坚实的技术支撑。


学科发展的内在需求则成为技术落地的核心动力。历史文献具有大体量、广分布、多模态、多语种的特征,单靠学者或研究团队难以全面驾驭,人工智能辅助研究成为当前学者聚焦前沿问题展开探索的必然选择。以近代史为例,近年来相关研究正经历从宏观叙事到微观实证、从单一学科到跨学科融合的深刻转型,国产大模型精准匹配了这一转型中的核心需求,成为推动研究深化的重要动力。

马思宇认为,在微观史、跨学科、深度实证等具体研究领域,这种需求更为突出。例如,研究近代城市化进程,需要整合人口统计数据、城市规划档案、交通日志等多种类型资料;研究思想传播,需要追踪核心概念在不同报刊、群体中的扩散路径。国产大模型平台整合的多模态处理、关联挖掘、可视化呈现等功能,精准匹配了这些核心需求,成为推动研究深化的重要动力。

进一步而言,技术引入正使文献资料实现从静态命中到知识推理的检索增强生成(RAG)转变。何为检索增强生成?朱本军向记者解释道,这是一种直接利用大模型的自然语言理解、复杂推理和多模态能力,从海量史料中挖掘“不可见”的关联并直接生成结果,将隐性知识脉络显性化的技术。随着该技术的应用,史学工作者的综合学术判断力将在史学研究中愈发占据主导,推动史学研究层次与质量的整体提升。

陕西师范大学历史文化学院讲师张光伟及其团队的实践颇具代表性。他们借助自主研发的西夏文OCR系统,将构造复杂的西夏文字典《文海》高精度转录为机器可读文本,为深度分析奠定基础。“技术不再是单纯的辅助工具,而是成为解决传统人文问题的核心方法论。”张光伟表示,未来这类方法可广泛应用于人物关系网络、观念传播路径等复杂问题研究,推动研究范式革新。

值得关注的是,国产大模型为构建中国自主知识体系提供了关键支撑。多位学者提出,国外模型以英文数据为主,难以准确理解中国特有历史概念与古今异义词汇,而国产大模型基于本土化语料训练,从根本上解决了这一适配难题。“基于海量本土史料的分析,有助于中国史学研究摆脱‘西方中心论’的叙事局限,为国际学术界传递‘中国声音’提供了扎实的实证支撑。”马思宇说。

资源整合与顶层设计不足是突出挑战

国产大模型为数字史学带来前所未有的发展机遇,但作为新兴领域,其在资源整合、技术适配、生态构建等方面仍面临诸多挑战。未来要在技术迭代与人文坚守之间找到平衡点,实现可持续的体系化推进。

关于史学研究是否会迎来范式转型,学术界也有理性的探讨。王涛认为,人工智能虽然改变了史学家的工作流程,在方法论层面带来诸多新可能,但在认识论层面,研究范式与学者的学术品位、审美紧密相关,能否实现根本性转型仍需观察。更多学者则认为,当前数字史学仍处于“史学数字化”阶段,实证本质未改变,但随着史料被构建成“语义化历史知识世界”,未来或将转向史学研究思维重塑——学者将更注重提出综合性“大问题”,利用智能工具探索历史可能性,开展思想实验。

资源整合与顶层设计不足是当前面临的突出挑战。因缺乏整体部署,各单位重复建设、各自为战的现象较为普遍,造成资源浪费。对此,徐永明建议,需加强政策引导与统筹协调,以长远战略眼光加大对人文领域大数据发展的支持,避免低水平建设与资源错配。

技术层面,建立标准化体系成为基础工程。马思宇提出,应由史学界与档案界联合制定史料数字化标准,明确扫描分辨率、元数据标注规范等核心要求,逐步构建高质量史料数据库,破解资源壁垒。朱本军补充道,未来还需建立“定本”文献资源库和更为规范的“命名实体”库,为机器介入推理消歧和定准提供更具标准化、结构化和唯一性的权威数据版本。

在应用模式上,专属知识库与大模型的深度融合成为核心方向。张光伟认为,未来主流应用将是检索增强生成系统向智能体系统演进,真正的竞争力不在于模型本身,而在于能否将核心研究资料科学整合进知识库,并将大模型能力无缝嵌入研究全流程。这种深度整合与模式创新,将是数字史学发展的关键。

从长远来看,数字史学的成熟必然是技术与人文的深度融合。当技术真正成为贴合史学研究需求的学术伙伴,而非游离于学科之外的工具附庸时,必将推动我国历史研究进入实证更扎实、视角更丰富、话语更自主的新阶段。在这一过程中,既要保持对技术创新的开放态度,又要坚守史学研究的人文底色,让数字技术真正服务于“究天人之际,通古今之变”的史学使命,为传承中华优秀传统文化、构建中国自主知识体系提供有力支撑。

中国社会科学报记者 刘越

来源:中国社会科学报

新媒体编辑:常畅

如需交流可联系我们

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

中国社会科学网 incentive-icons
中国社会科学网
中国社会科学院官方网站
18843文章数 25584关注度
往期回顾 全部

专题推荐

洞天福地 花海毕节 山水馈赠里的“诗与远方

无障碍浏览 进入关怀版