![]()
![]()
英文“Intelligence”在词典中有两个核心定义:一是人类获取和应用知识的技巧与能力;二是情报,最初指军事情报,后来扩展到经济情报和社会情报。我认为,这两个定义必须结合考虑。情报的本质是KAO:Knowledge(知识)、Action(行动)和Organization(组织)。未来的智能也应如此,不应仅是简单算法,应是以KAO形式开展,有知识,有组织,有行动。
![]()
2016年6月5日,墨子沙龙邀请到王飞跃教授在中国科学技术大学上海研究院作主题为《智能的本源——历史与展望》的讲座。本文根据报告整理而成。
1
第一部分
追溯“智能”历史,从古希腊到达特茅斯
今年(注:讲座举办于2016年)是达特茅斯会议(Dartmouth Conference)召开60周年,许多人以此作为人工智能“诞生”的标志,将其视为智能历史的起点。其实人类智能的起源远早于此,从猴子时代开始,我们就已具备基本的智能形式,怎么能说只有60年呢?
![]()
▲坐落于美国新罕布什尔州汉诺威小城的达特茅斯会议旧址,来源:清华大学
达特茅斯会议于1956年顺利召开,其最大功臣是约翰·麦卡锡(John McCarthy)。作为Lisp语言[1]的创始人,麦卡锡毕业于普林斯顿大学数学系,与“人工智能之父”马文·明斯基(Marvin Lee Minsky)是同系校友。毕业后,他前往达特茅斯学院任教。早在1955年,麦卡锡就萌生了创建人工智能领域的想法,他创造了“Artificial Intelligence”(人工智能)这一术语,并向洛克菲勒基金会写信申请经费,提出举办人工智能的研讨会。最终,他们获得了资助,会议吸引了十几位专家参加。
在我看来,麦卡锡虽是发起者,但最大贡献者是明斯基。人工智能的三大主要学派[2]中,有两个是由明斯基创立的:符号主义和连接主义。明斯基是最早在博士论文中提出随机神经元网络的人。此外,明斯基还是认知科学家,而非单纯的人工智能专家。
![]()
▲年轻时的马文·明斯基,来源:百度百科
回顾人工智能的古代和近代史,其实可以追溯到三位关键人物:亚里士多德、莱布尼茨,以及集大成者的乔治·布尔(George Boole)。
亚里士多德是第一个将逻辑形式化的人。他的形式逻辑奠定了符号主义的基础,三段论[3](syllogism)就是其核心贡献。莱布尼茨(Gottfried Wilhelm Leibniz)的影响同样深远。他发表微积分论文早于牛顿,当今微积分符号大多源于莱布尼茨。他还研究了“推理微积分”(calculus ratiocinator),旨在将思维模式化,这与我们今天计算机处理逻辑的方式一脉相承。更重要的是,二进制系统也是莱布尼茨发明的。
布尔创立了逻辑代数,即布尔代数,这是现代计算机、逻辑电路和电路设计的基础。随后,查尔斯·巴贝奇(Charles Babbage)设计并制作了第一台差分机和分析机[4],这些机械计算设备预示了计算机的雏形。接着,诺伯特·维纳(Norbert Wiener)创立了控制论(Cybernetics),将反馈机制引入系统科学。这些发展串联起人工智能的近代基础。
![]()
▲巴贝奇差分机2号互动模型,来源:清华大学科学博物馆
人工智能并非孤立出现,而是哲学、数学和工程的交汇。达特茅斯会议只是一个起点,它激发了后续的符号主义、连接主义和控制论等学派。从亚里士多德的逻辑形式化,到莱布尼茨的二进制和推理系统,再到布尔的代数逻辑,以及巴贝奇的机械计算和维纳的反馈理论,这些先驱共同铸就了人工智能的根基。
2
第二部分
苏格拉底、图灵与明斯基,古今学者的“智能观”
回溯智能的本质,英文“Intelligence”在词典中有两个核心定义:一是人类获取和应用知识的技巧与能力;二是情报,最初指军事情报,后来扩展到经济情报和社会情报。我认为,这两个定义必须结合考虑。正如阴阳互补——阳为智能,阴为情报,没有情报的智能如同盲人。谷歌和百度等正是基于此起家,它们从搜索引擎起步,擅长情报收集和处理。情报的本质是KAO:Knowledge(知识)、Action(行动)和Organization(组织)。未来的智能也应如此,不应仅是简单算法,应是以KAO形式开展,有知识,有组织,有行动。
![]()
▲单词“intelligence”在剑桥英语词典中的解释
不同科学家对智能的理解不同。西方哲学家苏格拉底持极端观点:“我知道我一无所知。”他认为无知是人类进步的动力,如果人类无所不知,我们的存在理由将消失。另一极端是爱因斯坦,他强调智能不止于知识,更需想象力:“想象力比知识更重要。”我个人认为,最靠谱的是约翰·冯·诺伊曼(John von Neumann)的观点。今天的社会印证了他的预言:知识的积累和应用是一个过程,随着人口的增加、积累的知识的增加,会有一个爆炸式的增长。现在的社会并非智能奇点,而是智能爆炸。
马文·明斯基是人工智能的真正思想家。他不相信智能有单一原理:“是什么不可思议的诀窍让我们变得智能?诀窍就是没有诀窍。智能的力量源于我们自身的巨大多样性,而非任何单个完美的原理。”我认同这一观点,也相信哥德尔不完备定理[5](Gödel's Incompleteness Theorems)和图灵不可判定性[6](Turing's Halting Problem)。这些定理揭示了有限与无限的本质矛盾:人类有限的生命试图理解无限宇宙,自然会存在这种矛盾。因此,我坚决不相信人工智能会“取代人类”。
艾伦·图灵(Alan Turing)的论文《论可计算数及其在判定问题上的应用》(On Computable Numbers, with an Application to the Entscheidungsproblem, 1936)定义了丘奇-图灵论题(Church-Turing Thesis):所有可计算函数均可由图灵机计算。这奠定了通用计算机的基础。他还在哲学杂志上发表《计算机器与智能》(Computing Machinery and Intelligence, 1950),提出图灵测试(Turing Test),评估机器是否具备人类智能。
![]()
▲艾伦·图灵(Alan Turing),来源:腾讯新闻
早期人工智能深受逻辑理论家影响,赫伯特·西蒙(Herbert Simon)和艾伦·纽厄尔(Allen Newell)开发的人工智能程序GPS(General Problem Solver),旨在模拟人类解决一般性问题的思维过程,是一个通用推理工具,这受到了罗素和怀特海的《数学原理》(Principia Mathematica)启发。西蒙曾预测:到1968年,数字计算机将赢得国际象棋冠军;十年后,又预言到1985年,电脑能完成男人的所有工作。这些预测虽未全实现,但已预见到人工智能领域的未来发展。
1996年,IBM开发国际象棋计算机深蓝,2016年,谷歌DeepMind开发围棋AI——AlphaGo。深蓝在1997年击败卡斯帕罗夫,AlphaGo在2016年击败李世石,这些都是AI史上的标志性事件。二者天差地别。深蓝是应用数学的巅峰:其计算路径透明,所有人都能追踪;AlphaGo则基于深度学习,其神经网络提取特征的过程黑箱化——连设计者也不知道提取了什么特征,这些特征又形成了怎样的特征空间。这正是智能的重要特征:无人知晓。如果一切透明,就不是智能,而是逻辑数学。最初,大家怀疑AlphaGo,因为它无法解释特征,但实践证明了深度学习在图像识别上的效用:机器翻译从低精度跃升,同声翻译和网络翻译的可用性,正是深度学习的成果。
然而,深度学习有自身局限。杰弗里·辛顿(Geoffrey Hinton)曾说:“如果你只有一个问题要解决,用神经网络就好。但若想从事科学、理解架构选择或迁移到新问题,你必须明白不同架构的能与不能。”
![]()
▲杰弗里·辛顿(Geoffrey Hinton)在2025世界人工智能大会上发言,来源:世界人工智能大会
3
第三部分
那些不为人知的“至暗时刻”
我们常说,人工智能只有酷暑和寒冬,却没有春天与秋天。发展至今,人工智能经历了至少九次“冬天”,即资金和兴趣锐减期。第一个冬天源于翻译失败。20世纪50年代,IBM开发乔治城翻译机器。宣称“电子大脑翻译俄语”,“双语机器”。然而,实际的演示只是将一套精心挑选的49个俄语句子翻译成英语,机器的词汇量仅限于250个单词。“The spirit is willing but the flesh is weak”(心有余而力不足,flesh指肉体)。早期机器翻译成俄文后,反译回英文,变成了:“伏特加酒是好的,可惜肉是烂的”(酒香而肉臭)。这导致1950年代末的翻译项目崩盘。
第二冬由明斯基和西摩·帕佩特(Seymour Papert)引发。他们在论文《感知机》(Perceptron, 1969)中,用单层神经元网络无法解决XOR问题(异或门),扩展结论批评整个领域,向美国军方报告不负责任言论,导致经费中断,十年无人触及神经网络。虽然后来他们澄清未否定感知机[7]的价值,但白纸黑字已造成了损害。直到1986年,并行分布式处理小组推出反向传播算法,神经网络复苏,才催生了今日的深度学习。
第三个冬天源于英国的Lighthill报告(1973),报告对人工智能的发展现状进行了评估,认为人工智能研究人员夸大了他们的承诺,发展人工智能技术是错误且徒劳的,这直接导致英国资助停止。随后是Lisp机器热潮和日本第五代计算机计划(1980s)。我亲历了这个浪潮,它对逻辑编程(Logic Programming)投入甚多。日本宣称投入巨资开发基于逻辑的计算机,但最终不了了之。我读过多本逻辑编程书籍,罗伯特·科瓦尔斯基(Robert Kowalski)的《逻辑作为万能钥匙》(Logic for Problem Solving)最佳。辛顿参与了神经网络的“第一次复活”,如今仍是深度学习领军人物。杰夫·霍金斯(Jeff Hawkins)的《论智能》(On Intelligence)也影响深远。
![]()
▲《Logic for Problem Solving》,来源:豆瓣
一次又一次冬天体现出人工智能发展的周期性,但每次复苏都会带来新的技术进步,比如符号主义、连接主义和深度学习。
如何实现真正的智能?当前多数AI是封闭的,局限于预设数据库。人脑的智能则是开放的:面对问题,人的思维瞬间扩散,激活脑海中过去历史、生活、知识和经历,整个大脑网络都会苏醒。人工智能现有的算法仅能激活内部知识库,如何扩展?还需要云计算、物联网和大数据等提供途径,促进从封闭智能转向开放智能。
生命的本源是获取知识、面对未知;智能的本源是利用已知解决未知。这将引领第五个时代:工业5.0。从第一代蒸汽机机械化、第二代电动机电气化、第三代计算机信息化、第四代路由器网络化,到第五代平行化(Parallelization),未来,大量人类将构建软件定义的系统:软件定义的你、我、房间、家庭、过程和产品。智能社会需要软件定义的一切(Software Defined Anything,),也将催生新行业:决策师、评估师、学习师、游戏工程师等。机器人也将平行化:物理机器与软件定义机器融合。
AlphaGo最神奇之处,就是海量计算中击败人类。我提出从丘奇-图灵论题转向AlphaGo论题(AlphaGo Thesis)。丘奇-图灵论题是一个猜想:所有可计算者均由图灵机计算,奠定计算机基础。AlphaGo论题则指出,复杂性问题可转化为可解形式。AlphaGo式结构不提供新算法,但划定范围后,AI可达到或超过人类水平。
![]()
▲李世石与AlphaGo人机大战,来源:百度百科
当今世界,90后、00后成长于碎片化、离散信息中。而智能产业需要深度知识,二者之间鸿沟巨大。因此,必须靠知识自动化、AI、机器人来弥补。经济学家西蒙曾凭有限理性(Bounded Rationality[8])获诺贝尔奖,有限智能也是有限理性。未来,智能将从固定知识转向流动智能,实现知识数字化、动态化和实时化。
注释
[1] Lisp语言诞生于 1958 年,由美国计算机科学家约翰・麦卡锡(John McCarthy)在麻省理工学院(MIT)主导设计,既是最早的函数式编程语言,也是首个专注于符号处理的语言。从诞生至今,Lisp 虽未成为大众主流语言,却在人工智能(AI)、计算机科学教育、自动化工具开发等领域持续发挥核心作用,其 “代码即数据、数据即代码” 的设计哲学,更是深刻影响了后续编程语言(如 Python、JavaScript、Haskell)的发展。
[2] 人工智能的研究可以划分为三大学派:符号主义、连接主义和行为主义。符号主义学派认为人工智能源于数学逻辑,其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。这一学派通过逻辑推理和符号操作来模拟人类的智能行为。例如,早期的专家系统就是基于符号主义的思想开发的。连接主义学派认为人工智能应该通过模拟人脑中的神经网络来实现。这一学派的研究重点是神经网络的结构、学习算法和应用。随着深度学习技术的兴起,连接主义学派在图像识别、语音识别等领域取得了显著成果。
行为主义学派认为人工智能应该通过感知和行动来实现智能行为。这一学派的研究重点是机器人的感知、行动和学习能力。行为主义学派的研究成果在智能机器人、自动驾驶等领域得到了广泛应用。
[3] 三段论:公元前4世纪,亚里士多德在《工具论》中首次提出三段论的完整模型,将其定义为“由三个命题组成的推理结构”(包含大前提、小前提和结论),并确立其为逻辑学的基石。
[4] 世界第一台差分机(1822年)和分析机(1834年)由巴贝奇设计。差分机计算精度达6位小数、可处理3个不同5位数;分析机能用多项式展开的方法计算对数和三角函数,它们是计算机的雏形,为现代计算机和人工智能的算法与硬件基础提供了关键思想原型。
[5] 哥德尔不完备定理(1931年)指出,在任何足够强的数学系统中,总存在既不能被证明也不能被证伪的命题,揭示了数学的局限性。
[6] 图灵不可判定性(1936年)证明,不存在一个通用算法能判断任意程序是否会停止运行,这是计算理论的基础,也影响了人工智能的边界。
[7] 感知机(Perceptron)由康奈尔大学心理学家弗兰克·罗森布拉特于1958年提出。作为首个模拟人类思维的实验性机器,感知机由美国海军资助,具备400个光传感器模拟视网膜,连接约1000个神经元进行信息处理,并输出单一结果。罗森布拉特将其定位为“首个类似人脑思维的机器”。
[8] 有限理性模型(Bounded Rationality Model),又称西蒙模型,由美国经济学家赫伯特·西蒙于20世纪50年代提出。该模型突破传统经济学“完全理性人”假设,主张用“社会人”取代“经济人”,认为决策者因信息获取能力、计算能力和认知能力的限制,只能在有限范围内做出理性选择。
文字整理:诗学
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.