网易首页 > 网易号 > 正文 申请入驻

计算语言学3次死亡:从符号规则到概率炼金术,它活成了自己最讨厌的样子

0
分享至

1970年代,乔姆斯基(Noam Chomsky)的生成语法统治着语言学。那时的计算语言学像一位严谨的图书管理员,试图用有限状态自动机(一种描述语言规则的数学模型)把人类语言锁进符号的抽屉。规则是清晰的,边界是明确的,世界是可控的。

这套系统在1990年代第一次咽气。

统计方法来了。IBM的翻译模型不再追问"为什么",只计算"有多像"。语言变成了概率分布,语法变成了n-gram(一种基于词序列频率的统计模型)的共现矩阵。规则派的老教授们骂这是"炼金术",但机器翻译的错误率确实降了40%。实用主义赢了第一轮。

神经网络把尸体又挖了出来

2013年,词向量(Word2Vec)让词语在多维空间里自动寻找邻居。"国王"减"男人"加"女人"等于"女王"——这种类比推理不是人类写进代码的,是模型自己从数十亿文本中啃出来的。

2017年Transformer架构(一种基于注意力机制的深度学习模型)出现后,事情变得更怪。注意力机制不再拆解句子结构,而是让每个词同时"看见"所有其他词。语言学家花了两百年建立的句法树,被自注意力权重(一种衡量词与词之间关联强度的参数)悄悄绕过。

「我们不再问机器如何理解语言,我们问的是:当机器以十亿token(文本最小单位)的规模参与语言生产时,语言本身变成了什么?」——Riaz Laghari在Quaid-i-Azam大学的讲座中抛出这个问题。他的答案是:符号结构、概率建模、神经表征的三体碰撞。

第三次重生正在发生

2023年后的局面更复杂。大语言模型(LLM)既能生成符合语法的句子,又会在算术题上犯人类不会犯的错。这种"能力涌现"(emergence)现象让研究者分裂成两派:一派认为这只是规模效应的幻觉,另一派坚持量变已经引发质变。

计算语言学的研究对象正在漂移。它不再只是分析"句子是否合法",而是追踪"模型为何在特定提示下突然崩溃"。提示工程(Prompt Engineering)成了一门新方言——不是人类学机器说话,是机器倒逼人类发明新的表达方式。

Laghari的观察很克制:这个学科的核心假设正在被重写。语言的认知基础、结构本质、意义生成——这些曾经属于哲学和理论语言学的领地,现在成了工程问题的副产品。

最讽刺的转折在2024年出现。

符号派的方法开始回潮,但身份变了。思维链(Chain-of-Thought)技术让模型"一步步思考",本质上是用线性符号序列约束神经网络的跳跃。知识图谱(一种结构化的语义网络)被重新嵌入大模型,不是为了取代注意力机制,是为了给它装刹车片。

三股力量现在拧在一起:符号规则提供可解释性骨架,概率模型填充不确定性血肉,神经网络负责模式识别的本能。没有哪一方能单独存活。

这个领域的老兵正在经历认知失调。他们中的许多人入行时相信语言有深层普遍语法,现在却在调参(调整模型参数)日志里寻找"涌现能力"的阈值。一位从业者在Hacker News的匿名帖子里写:「我花了十年学乔姆斯基,现在我的KPI是让模型别在总结会议记录时 hallucinate(产生幻觉)。」

计算语言学没有变成应用语言学,也没有沦为纯粹的工程。它卡在更尴尬的位置:必须同时理解Transformer的数学结构和人类对话的微妙张力,却不再拥有单一的理论锚点。

语言是什么?这个问题现在有了三个不兼容的答案,而从业者被要求在同一个项目里同时调用它们。这不是方法论多元化,是根基性的混乱——也可能是新秩序的前夜。

当机器生成的文本占到互联网新增内容的60%以上,计算语言学家的研究对象已经包括了自己的造物。他们分析的语言样本里,混着模型去年生成的句子;他们训练的模型,又在消化自己前辈的输出。这个递归循环会把语言带向哪里——是更丰富,还是更贫瘠?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赖清德急了!回台湾就被抓?郑丽文和大陆谈完,临走前达成了共识

赖清德急了!回台湾就被抓?郑丽文和大陆谈完,临走前达成了共识

轩逸阿II
2026-04-12 18:34:08
不如国乒团结!日本世乒赛前内讧 张本智和:松岛辉空是我的威胁

不如国乒团结!日本世乒赛前内讧 张本智和:松岛辉空是我的威胁

念洲
2026-04-13 08:51:46
Kimi大量正脸照流出!身高1米8、嘴凸不像林志颖,下半张脸像妈妈

Kimi大量正脸照流出!身高1米8、嘴凸不像林志颖,下半张脸像妈妈

傲傲讲历史
2026-04-14 01:58:50
高速收费5月1日起变了!不按最远路径计费,车主出行迎实惠

高速收费5月1日起变了!不按最远路径计费,车主出行迎实惠

小谈食刻美食
2026-04-11 10:12:23
挪威站队了!正式向世界宣布:必须在全球范围内孤立以色列

挪威站队了!正式向世界宣布:必须在全球范围内孤立以色列

谛听骨语本尊
2026-04-13 16:12:26
贾乃亮庆祝42岁生日,女儿甜馨温暖陪伴!网友:盼望亮哥复婚!

贾乃亮庆祝42岁生日,女儿甜馨温暖陪伴!网友:盼望亮哥复婚!

娱乐团长
2026-04-13 20:09:22
大陆公布10项对台红利后,蒋万安表态变了,侯友宜应该惭愧了

大陆公布10项对台红利后,蒋万安表态变了,侯友宜应该惭愧了

史行途
2026-04-14 02:34:35
面相师傅:无论男女,眉心有竖纹,预示着你后半生的3种命运

面相师傅:无论男女,眉心有竖纹,预示着你后半生的3种命运

卡西莫多的故事
2026-02-02 11:46:25
中国跳水队公布世界杯总决赛名单:陈芋汐、陈艺文在列

中国跳水队公布世界杯总决赛名单:陈芋汐、陈艺文在列

懂球帝
2026-04-13 22:48:15
20分钟内高效拿下17分!快船后场大将的得分能力其实并不差?

20分钟内高效拿下17分!快船后场大将的得分能力其实并不差?

稻谷与小麦
2026-04-14 01:44:52
是时候摊牌了,中方明确信号:要打,战火必须烧进美国本土!

是时候摊牌了,中方明确信号:要打,战火必须烧进美国本土!

史说方休
2026-04-11 01:23:59
掀掉洋葱顶,整治宗教泛滥的第一步

掀掉洋葱顶,整治宗教泛滥的第一步

黑哥讲现代史
2026-03-14 15:46:38
俄罗斯旅游回来,难以置信1.47亿人口的俄罗斯,发展成这样了

俄罗斯旅游回来,难以置信1.47亿人口的俄罗斯,发展成这样了

兴史兴谈
2026-04-12 22:13:25
9岁男孩被父亲关在车里近2年,几乎不会走路了,还说都是为了儿子好?

9岁男孩被父亲关在车里近2年,几乎不会走路了,还说都是为了儿子好?

英国那些事儿
2026-04-12 23:19:35
春天使劲吃,钙比黄豆高2倍,钾比苹果高3倍,中老年人要常吃

春天使劲吃,钙比黄豆高2倍,钾比苹果高3倍,中老年人要常吃

阿龙美食记
2026-04-12 14:51:46
雷军发文:西班牙首相桑切斯今天中午到访小米总部,试用小米17 Ultra并拉我一起自拍,试乘YU7后对天际屏好评很高

雷军发文:西班牙首相桑切斯今天中午到访小米总部,试用小米17 Ultra并拉我一起自拍,试乘YU7后对天际屏好评很高

鲁中晨报
2026-04-13 17:20:12
巴铁彻底服了。

巴铁彻底服了。

安安说
2026-04-13 10:40:06
用血泪教训告诉大家:人过60后,不要去买房,老了有现金才有底气

用血泪教训告诉大家:人过60后,不要去买房,老了有现金才有底气

小马达情感故事
2026-04-13 19:35:03
学风最好的10所大学!武汉双雄进前五,排名第一的没有想到

学风最好的10所大学!武汉双雄进前五,排名第一的没有想到

史海流年号
2026-04-07 20:40:02
意外!白云山隧道或重启,天河白云10分钟互通

意外!白云山隧道或重启,天河白云10分钟互通

广州楼市发布
2026-04-13 20:24:52
2026-04-14 03:31:00
Ping值焦虑
Ping值焦虑
有态度网友ytd
1292文章数 22关注度
往期回顾 全部

教育要闻

高考地理中的数字孪生

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

谈判未完全关闭?3国力促美伊重启谈判

科技要闻

"抄作业"近四年,马斯克版微信周五上线

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

时尚
健康
教育
数码
公开课

今年春夏一定要拥有的4条裙子,这样穿减龄又好看!

干细胞抗衰4大误区,90%的人都中招

教育要闻

老师们活的通透的几大标准,看看你做到了吗?

数码要闻

壹号本ONEXStation i1迷你主机发售,18999元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版