网易首页 > 网易号 > 正文 申请入驻

语言学 | 人工智能变革语言学研究

0
分享至

当下,人工智能特别是基于大语言模型的生成式人工智能正深刻影响着人们生活的各个方面。GPT、DeepSeek等大语言模型的出现,使得语言学研究面临新的挑战和机遇。语言学作为研究语言本质、结构、演变及应用的学科,在人工智能的推动下,正经历着前所未有的变革。传统的语言学理论与方法在大数据、机器学习等技术的支持下,得以更加精准地解析语言现象、预测语言发展趋势。人工智能的引入为语言学研究提供了新的视角和工具,使得语言学家能够以前所未有的深度和广度探索语言的奥秘。语言学与人工智能互相影响、互相交融,二者协同演进大致可分为如下几个阶段。

第一阶段:传统语言学主导期(20世纪50年代至80年代)。这是传统语言学与计算机技术的早期碰撞时期。1956年“人工智能”概念提出后,乔姆斯基于1957年发表的《句法结构》中提出生成语法理论,主张语言能力源于生物遗传的普遍语法,语言学研究的目标是揭示这种内在机制,其“有限规则生成无限句子”的假设为计算语言学奠定了形式化基础。20世纪50年代,计算语言学成为一门独立的学科。1954年,Georgetown-IBM机器翻译实验首次尝试将语言学规则编码为计算机程序,标志着语言学与计算机科学的首次结合,但受限于双语词典和人工编写的句法转换规则,一些翻译质量较为粗糙。20世纪60年代中期到80年代末期,计算语言学进入发展期。随着计算机科学与技术领域各类程序语言的开发以及乔姆斯基语言学理论的进展,计算语言学有了突破性的发展,20世纪70年代至80年代研发出较多能够对自然语言进行较好处理的系统。该阶段语言学与计算机初步结合,但技术未动摇理论内核,计算技术仅作为辅助工具,用于语料数字化或规则验证,未对语言学理论带来实质性冲击。

第二阶段:计算语言学与规则导向的并行期(20世纪80年代末至21世纪初)。在这一阶段,统计模型兴起对语言学规则产生了冲击,学术界对生成语法的解释力产生怀疑。从20世纪 80年代末开始,计算语言学进入了繁荣期。1988年,IBM研究团队提出基于统计的机器翻译模型,利用双语语料库计算词对齐概率,取代人工编写转换规则。20世纪90年代,隐马尔可夫模型(HMM)在语音识别中的商业化应用,进一步表明了统计方法的实用性。这些统计模型的成功引发了学术界的激烈争论。乔姆斯基批评统计方法“仅能描述语言现象,无法解释深层结构”,认为其背离了语言学的科学使命。与此同时,部分学者尝试融合两种范式,如定子句语法(Definite Clause Grammar)将逻辑规则与概率计算结合,但收效有限。该阶段语言学规则与统计方法并存,但语言学仍在主导算法设计。语言学内部形成两大阵营:一方坚持生成语法的理论纯洁性,另一方则转向计算语言学的应用研究。

第三阶段:数据驱动的颠覆期(21世纪10年代)。深度学习使语言处理脱离人工规则,倒逼语言学反思理论根基。2013年,Mikolov团队提出Word2Vec模型,将词语映射为连续向量,实现词语向量化。2015年,深度学习对语言学理论的冲击达到高潮。辛顿宣称:“语言结构无需先天预设,统计规律足以覆盖人类语言行为。”2017年,Transformer架构通过自注意力机制突破句法树分析框架,催生BERT、GPT等大模型。这些模型仅通过预训练海量文本即可生成连贯语句,无需显式语法规则。2019年,Bender等学者提出“随机鹦鹉论”,指责大模型仅模仿表面形式,缺乏语义理解,生成语法学派陷入被动。深度学习改变了语言处理范式,大语言模型通过海量数据训练,突破了规则系统的局限性,直接挑战乔姆斯基理论,引发学术争议,语言学研究从规则导向转向数据驱动。计算语言学领域出现统计模型与规则系统的路线之争,语言学家被迫重新定位角色:或回归本体理论研究,或探索规则与数据的结合路径。

第四阶段:人工智能赋能的深化融合期(2020年至今)。2020年,GPT-3实现零样本学习,人工智能变为语言学研究的“增强工具”。2022年底,ChatGPT横空出世,人工智能进入大语言模型时代。ChatGPT的对话能力使非专业人士可快速测试语言学假设(如方言生成、句法容错性)。科大讯飞利用人工智能技术寻找濒危语言中不同尺度的音节语义之间的关联和模式,并形成语音库,实现了濒危语言的留存。这些都体现出人工智能技术与语言学研究的融合。Google发布多语言BERT模型,涵盖104种语言的语法特征向量,学者可据此量化分析语序共性,这使“语言类型学从定性分类推向定量建模”。2025年4月,缅甸发生地震后,DeepSeek用7小时攻克缅甸救灾语言关,为救援工作提供了关键的语言支持,彰显了人工智能在紧急情况下的应用潜力。人工智能技术加速了语言数据的处理与分析,促进了语言学理论的验证与创新。在人工智能赋能的深化融合期,语言学研究不再局限于传统的理论探讨,而是更加注重理论与实践的结合。这种跨学科的合作模式使得语言学与人工智能相互借鉴、不断融合,为未来的语言学研究指明了方向。

自20世纪中叶生成语法理论确立以来,语言学便围绕“人类语言能力的本质”展开追问。乔姆斯基通过形式化规则系统,将语言研究锚定于人类先天性的理论预设,这一范式主导学术界长达半个世纪。然而,随着人工智能的快速发展,语言学的认识论根基正遭遇前所未有的挑战:从早期基于词典的机械规则映射,到深度学习驱动的人工智能,技术路径的迭代不仅重塑了语言分析的工具,更迫使学术界直面“先天论”与“经验论”的问题。2017年Transformer架构的问世,标志着语言模型摆脱人工语法标注的限制,通过自注意力机制实现语义的分布式涌现,这一技术不仅颠覆了传统句法树的分析框架,更催生出“语言结构是否必须预设先天模块”的讨论与思考。当前的大语言模型通过纯数据驱动,在零样本任务中生成符合语法的复杂句式,直接挑战乔姆斯基的理论预设。社交媒体文本挖掘、情感分析等NLP应用,揭示了语言使用的动态社会性,促使学术界审视“语言能力”是否应包含社会交互维度。如何在人工智能的背景下反思语言学理论、把握语言的本质、探索语言与人工智能的交互机制,成为当前语言学研究的重要课题。

在人工智能时代,语言学家开始从理论到实践反思语言学科的发展。大语言模型的飞速发展,正促使语言学研究进入一个全新的发展阶段。语言学家意识到,传统的语言学理论与方法虽然有其独特的价值,但在面对大数据、机器学习等现代技术的挑战时,也需要进行适度的调整与创新。与大语言模型的结合,为语言学研究提供了新的思路和方法。许多学者也认识到,人工智能对语言学的冲击并非单纯的方法论扩展,而是触及学科理论基础。可以想象,当多模态大模型能够自主关联视觉场景与语义指称时,索绪尔传统的符号任意性原则是否需要重新被审视?当机器翻译系统在低资源语言中展现超越人类的形态归纳能力时,历史语言学的谱系建构是否面临范式革新?对这些问题的回应,或将决定语言学在人工智能时代的定位。未来,随着大语言模型的不断发展和完善,语言学研究将迎来更多的机遇与挑战。语言学家需要继续深化与人工智能技术的融合,不断探索新的研究方法和思路,以更好地揭示语言的本质和规律,为人类的语言交流和文化传承作出更大贡献。同时,也需要加强跨学科的合作与交流,推动语言学与人工智能的协同发展。

(本文系国家社科基金后期资助项目“现代汉语标题用词与标题句式研究”(2024FYYB066)阶段性成果)

(作者系黑龙江大学文学院副院长、教授;黑龙江大学汉语研究中心副研究员)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

新华社
2026-01-24 23:03:04
炸了!孔蒂赛后怒撕切尔西:我们拼到只剩 13 人,他们只靠砸钱!

炸了!孔蒂赛后怒撕切尔西:我们拼到只剩 13 人,他们只靠砸钱!

澜归序
2026-01-29 08:52:38
贝嫂无声的反击:和3个孩子2个准儿媳拍全家福,趾高气扬无视大布

贝嫂无声的反击:和3个孩子2个准儿媳拍全家福,趾高气扬无视大布

照见古今
2026-01-28 18:29:15
曼联进欧冠有助获1.75亿!卡里克训练示范惊呆球员,你们不行我上

曼联进欧冠有助获1.75亿!卡里克训练示范惊呆球员,你们不行我上

罗米的曼联博客
2026-01-29 11:07:27
2026异地就医大调整,不用备案直接报,这三类人享专属福利

2026异地就医大调整,不用备案直接报,这三类人享专属福利

复转这些年
2026-01-29 03:00:03
第二批禁足名单公布!73人终身禁足3人禁足5年,陈戌源李铁在列

第二批禁足名单公布!73人终身禁足3人禁足5年,陈戌源李铁在列

奥拜尔
2026-01-29 12:24:34
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
公司团建没通知我,我假装不知道,第二天主管当众让我滚

公司团建没通知我,我假装不知道,第二天主管当众让我滚

故事那点事
2026-01-19 06:30:08
小玥儿又被爷爷“截胡”了,全网说她俩抢孩子,抢得这么温柔的?

小玥儿又被爷爷“截胡”了,全网说她俩抢孩子,抢得这么温柔的?

草莓解说体育
2026-01-29 12:30:50
周海媚去世2年多,演员李勤勤晒出收养的周海媚的两条金毛近况,并配文:以爱赴诺,跨越山海的思念与成全

周海媚去世2年多,演员李勤勤晒出收养的周海媚的两条金毛近况,并配文:以爱赴诺,跨越山海的思念与成全

鲁中晨报
2026-01-28 21:23:06
5-4绝杀!徐思战胜塞尔比,德国赛16强出炉,4位世界冠军爆冷出局

5-4绝杀!徐思战胜塞尔比,德国赛16强出炉,4位世界冠军爆冷出局

小火箭爱体育
2026-01-29 08:16:36
尼帕病毒气势汹汹!对我们春节有影响吗?它害怕这5件事,记住了

尼帕病毒气势汹汹!对我们春节有影响吗?它害怕这5件事,记住了

现代小青青慕慕
2026-01-28 09:11:03
布鲁克林分享爱妻惬意床照,妮可拉赤裸上身瘦脱相,原因令人称赞

布鲁克林分享爱妻惬意床照,妮可拉赤裸上身瘦脱相,原因令人称赞

夜深爱杂谈
2026-01-28 22:52:08
两个省会城市纪委书记调整

两个省会城市纪委书记调整

上观新闻
2026-01-29 12:39:19
火箭99-111马刺4坏消息!申京谢泼德战犯,乌度卡下半场糟糕用人

火箭99-111马刺4坏消息!申京谢泼德战犯,乌度卡下半场糟糕用人

篮球资讯达人
2026-01-29 13:34:38
字母哥离队概率升至55%!三大心仪下家曝光:专家解析交易难度

字母哥离队概率升至55%!三大心仪下家曝光:专家解析交易难度

罗说NBA
2026-01-29 01:45:33
现货黄金短线回落超100美元

现货黄金短线回落超100美元

财联社
2026-01-29 08:08:05
严禁强制打卡 严禁事事留痕

严禁强制打卡 严禁事事留痕

南方都市报
2026-01-29 07:05:12
特朗普被曝“正考虑对伊朗发动新的重大打击”!伊高官:美若动武将打击特拉维夫的“心脏”!伊外长:手指已扣在扳机上......

特朗普被曝“正考虑对伊朗发动新的重大打击”!伊高官:美若动武将打击特拉维夫的“心脏”!伊外长:手指已扣在扳机上......

每日经济新闻
2026-01-29 09:30:09
14分20板?!杨瀚森生涯最佳夜没被怪物数据掩盖

14分20板?!杨瀚森生涯最佳夜没被怪物数据掩盖

贵圈真乱
2026-01-28 11:49:41
2026-01-29 13:48:49
积学储宝 incentive-icons
积学储宝
观点集萃
3865文章数 488关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

82岁大爷背包独自出国旅行10年 1个月花掉近1年退休金

头条要闻

82岁大爷背包独自出国旅行10年 1个月花掉近1年退休金

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

张译不再隐瞒!公开回应退圈息影真相

财经要闻

黄金价格太高了吗

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

教育
艺术
本地
健康
公开课

教育要闻

江苏将迎80天“超短学期”

艺术要闻

梵高全集(高清350张)震撼……

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

耳石症分类型,症状大不同

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版