AI，对学术研究有什么帮助|古籍|翻译|考古学|人工智能

分享至

来源：光明日报

编者按

《国务院关于深入实施“人工智能+”行动的意见》提出，推动哲学社会科学研究方法向人机协同模式转变，探索建立适应人工智能时代的新型哲学社会科学研究组织形式，拓展研究视野和观察视域。

此前，本版曾推出专题报道《人工智能：来自科学，改变科学》，探讨了人工智能给自然科学研究带来的变化。本期走进哲学社会科学领域，邀请专家学者谈谈他们在日常研究工作中使用AI的探索和思考。

古籍整理与研究有了得力“助手”

讲述人：北京师范大学文学院教授、汉字汉语研究与社会应用实验室主任王立军

一部未经整理的古籍，其字形认同、句读标点、词义考辨、典故溯源，每一项工作都对研究者的专业学养和时间投入提出极高要求。传统的人工整理模式不仅周期长、成本高，也因专业人才的稀缺，使得大量古籍文献难以得到及时有效的整理和利用。我们一直在思考，能否借助现代科技，为这项古老而崇高的事业注入新的能量？

人工智能技术的快速发展，为我们提供了解决这一难题的新思路。2022年，在国家文化数字化战略的指引下，我们团队获批承担国家语委重大项目，致力于利用人工智能前沿技术，攻克古籍整理数字化和智能化中的关键难题。

这条道路充满挑战。通用大语言模型在标引或释读古汉语文本时，容易出现内容篡改和事实性错误等“幻觉”现象，无法做到对古汉语专业领域知识的准确理解。因此，我们选择从头训练垂直领域模型，利用大规模、高质量的专业古籍语料来应对通用大语言模型的这一弊端。为致敬近代国学大师章太炎先生，我们将该模型命名为“AI太炎”。过去，一位学者整理一部典籍的初稿可能需要数月乃至数年；如今，“AI太炎”能在短时间内完成一部古籍文本的自动标点、注释生成、文白翻译、典故提取等基础性工作。

然而，这并不意味着AI将取代学者。恰恰相反，它将我们从大量烦琐、重复的基础劳动中解放出来，使我们能够聚焦于更具深度和创造性的学术探究。譬如，在汉语词义的演变研究中，我们利用“AI太炎”的智能释义技术，对近2亿字语料进行全量标注。当古今汉语词汇的意义流变轨迹，以系统性数据的形式清晰呈现时，我们得以用一种全新的、数据驱动的方式，去观察和分析语言演变的宏观规律。这在过去是难以想象的。

学术成果的生命力在于其社会价值。我们积极推动“AI太炎”在多元场景中落地应用：与出版机构合作，将AI融入古籍数字化整理的工作流程；研发多语种翻译功能，支持将文言文翻译为英、法、俄、日等语言；建设文言文知识库和分级阅读语料库，研发学习难点自动识别、知识点自动关联等教学辅助技术，服务一线语文教学需求……

当然，我们对AI的应用边界和潜在风险保持高度的审慎。首先，AI并非全知全能，对于知识盲区和复杂情境可能输出不准确内容，因此其结果应作为“参考”而非“定论”，专业人士的审核把关不可或缺。其次，要警惕因技术依赖导致的思维惰性，尤其在人才培养中，原典阅读和句读训练等传统方法仍十分必要。此外，人文学科更应坚守人文关怀和对文史知识的深刻洞察——AI虽能高效处理信息，却难以触及文字背后的复杂情感和深邃思想。人文学者的创造力与洞察力，始终是古籍整理与研究中不可替代的核心。

作为新时代人文学科的研究者，我们既要积极拥抱技术变革，也要坚定守护人文学科的核心价值与学术精神。我们相信，通过人机协同的创新实践，那些沉睡在典籍中的古老智慧，必将得到更有效的活化与传承，在新时代绽放出更加璀璨的光芒。

这可能是考古学的“第三次革命”

讲述人：山东大学文化遗产研究院院长、讲席教授方辉

当前，陶器研究逐渐从编年史的视角转向对其与社会关系的关注，陶器社会研究因此成为重要话题。陶器社会研究可以说是碳-14测年技术带来的，它使考古学家有了绝对年代标尺，对考古学来说是一次革命性发展。如果说碳-14测年解决的是年代序列问题，那么DNA研究则触及了人本身以及社会组织的问题，为考古研究又带来革命性转变，而且这个转变还在进行中。

目前，在考古中有一种现象还没有引起足够重视，那就是跨坑拼对现象。我们在发掘中曾遇到这种情况：一个陶器散落在相距40米的不同地方，但由于它上面有暗纹，无意当中一拼对，发现它们是同一件器物。出土这两个陶片的两个不同的灰坑，围绕着一个大祭坛分布，形成了一个共时的活动遗留。这提示我们，跨坑拼对，对于微观聚落的共时性建构是非常重要的。

然而，考古工作者总是要处理海量的文物遗存，人工拼对有时候很难进行识别，因为这不只涉及一个灰坑、一个地层，甚至是一个遗址。面对海量的陶片，通过人力实现拼对从而证明不同单位的共时性是很难的。但是，人工智能却是可能实现的，它可以快速进行识别，并尝试加以验证。

从2024年起，我们选取济南大辛庄遗址中的一个灰坑开展考古工作，这个灰坑分为14层，包含18000多片陶片。我们在对每一片陶片进行编号、拍照、记录等数据采集过程中发现，这些陶片都有层位信息，可以实现跨层拼对。但由于数量庞大，人工拼对短期内难以完成，我们决定试试AI。

于是，我们向全球开放了这些珍贵的考古数据，并发起了“大辛庄陶片拼合AI挑战赛”，要求参赛团队开源其解决方案。我们希望参赛者能够开发出具有通用性和可解释性的算法模型，有效应对陶片历经3000年风化、磨损和颜色失真等复杂情况。

最终，参赛者提交了300多份解决方案，但因为陶片的正反面信息、厚度、曲率都会对AI拼对造成困难，需要庞大的算力支撑，最终实现有效拼对的不是很多。目前，据不完全统计，在18000多片陶片中，有效拼对的大约有60个。

不过，基于AI的陶器研究，其意义并非仅仅在于单纯地增加可拼对的器物数量。实际上，它的潜在价值对于微观聚落考古的共时性建构至关重要。拼合出的器物形态与数量，可以作为我们理解当时社会组织、生活图景和文化交流的重要线索。相信随着AI拼对技术的成熟，它未来可能会给考古学带来对古代社会不一样的理解。也许，这正是考古学的“第三次革命”。

为国际传播提供更科学精准的参考

讲述人：湖南师范大学人工智能与精准国际传播实验室主任高协平

过去，要研究一个国际热点事件的媒体报道，通常会抽样选择一些有代表性的媒体，统计分析其数百篇报道。这就像通过随机取几个水样，来推测整片海洋的成分。而现在，AI给了我们“驾驭整片海洋”的能力。

我们曾做过一项关于“一带一路”倡议全球传播的研究。通过AI驱动的网络爬虫，在几小时内就采集到上百个国家和地区、数十种语言、长达五年跨度的数百万篇新闻报道和社交媒体帖子。这个数据量，是传统方法很难做到的。但这只是第一步。面对这片信息的“汪洋”，如何分析？我们引入大数据方法和自然语言处理技术。AI模型可以自动对海量文本进行情感分析，精准识别不同国家媒体对该倡议的态度。通过主题建模，它能像一位不知疲倦的助手，自动归纳出外媒报道中最常出现的议题，譬如是聚焦“经济合作”还是“地缘政治”？是强调“基础设施建设”还是“文化影响”？这让我们从过去对“点”的推测，跃升到对“面”甚至“体”的精确描绘。我们不再只是“觉得”某个议题很重要，而是能通过数据“看到”它在整个信息生态中的权重、演变和关联。这种研究范式的转变，是革命性的。

随着以“我即媒体”为象征的社交媒体时代来临，传播学早已不限于文字形态，图片、表情包、短视频成为新时代的“世界语”。传统研究方法面对这些非文本内容，常常感到无力。但AI中的计算机视觉技术，为我们打开了新世界的大门。

我们研究过一些国际社交媒体上的中国形象传播。以前做这种研究需要招募一大批志愿者，人工观看成千上万的视频，记录其中出现的长城、高铁、京剧脸谱等中国元素，效率极低且主观性强。现在，我们训练AI模型，让它可以自动识别视频中的视觉符号，分析画面构图、色彩基调，甚至结合字幕和语音，进行更深刻的挖掘，做出更综合的判断。AI赋能下的多模态分析，让我们能够更全面、更立体地解读这个视觉化的传播时代，让那些“只可意会”的视觉修辞，变得“可以言传”，甚至可以量化分析。

可能有人会问：AI的“冷冰冰”数据，会不会取代人文社科的“温度”与深度思考？我们的回答是：不会。AI不是取代思想的“魔法”，而是解放生产力的“利器”。它将我们从烦琐、重复的劳动中解放出来，让我们有更多精力去进行理论构建、提出更具创见的假设，去解读数据背后深刻的社会、文化与心理动因。

展望未来，我们正尝试构建更智能的“精准国际传播”模型。希望利用AI，不仅分析“已经发生了什么”，还能预测“将产生怎样的结果”，更能精准建议“如何面向对未来”，从而为讲好中国故事提供更科学、更精准的决策参考。

“数智决策”改变金融理论与实践

讲述人：西南财经大学大数据研究院副院长徐亮

我来自西南财经大学大数据研究院“地方金融动态监测及系统性风险预警”团队。在AI技术飞速发展和国家“金融强国”战略结合日益紧密的当下，我越来越深刻地感受到，AI驱动的“数智决策”正在深刻改变金融理论与实践。

金融理论和实践，离不开预测和决策两个环节。预测就是对未来收益或者行为的预期。在数字时代，数据基础发生了根本变化，多模态混频数据，如交易流水、舆情文本、财报图像等文本、数字和图片同时存在，极大增加了预测难度。决策就是投资的决定或者面临风险的处置方式。传统的基于模型计算结果的决策模式，缺乏自我调节和修正能力，而“先预测、后决策”分离范式容易导致“预测准确但决策效果不佳”。

我在研究中面临多模态数据预测的一个典型场景，是“电碳融合”背景下的企业信用评级。以往的企业信用评级多基于企业财务信息。随着电力账户和碳账户数据的融合，有了更高频度和更多模态数据来源，如每15分钟更新一次企业电力负荷数据等。我们团队和国网湖北经研院及银行合作，将企业电碳账户和绿色金融深度融合，利用时间序列大模型，创新“多模态数据对齐表征技术”，对企业未来的用电负荷进行有效预测，针对细分行业和企业成长阶段性特点制定差异化的企业电碳信用体系和评价规范，推动企业电碳账户数据和评价结果与金融机构实现信息互通、结果互认。

套期保值是通过金融衍生品工具，如期货期权，来减少企业面临采购和价格风险的有效手段。过去，衍生品数量的决策往往依赖书本上的公式。为了使套期保值决策能动态反映市场环境和之前决策的损益情况，我们开发出套期保值智能体，使其具备动态反思和自适应调整能力，可以自动化完成企业套期保值决策生成。

AI还可以服务于金融安全监管。以反洗钱为例，大模型技术具有逐步推理和强化学习的决策能力，可针对不同的个体行为分析其可能参与洗钱的主要原因和最适合的处置措施。我们团队和四川省大数据中心合作，创新提出“基于激活函数的大模型动态强化学习”技术，在四川、山东等多地落地，为相关部门提供了多起P2P、电诈等重大风险事件预警。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

AI，对学术研究有什么帮助