网易首页 > 网易号 > 正文 申请入驻

《为什么伟大不能被计划》第七章:解开禁锢教育的枷锁

0
分享至

本文节选自《为什么伟大不能被计划:对创意、创新和创造的自由探索》,上一篇链接:

《为什么伟大不能被计划》第六章:没设定统一目标时,探索反而最可能大放异彩

《为什么伟大不能被计划:对创意、创新和创造的自由探索》,作者是肯尼斯·斯坦利(Kenneth Stanley)和乔尔·雷曼(Joel Lehman),他们是目前享誉全球的创业公司OpenAI科学家。两位作者持续多年扎根人工智能前沿领域,这本书是他们在科学研究的过程中蹦出的意外火花。他们在学校、TED、科研论坛等场合公开演讲,让这一新思维方式影响并激励了许多人。他们自身也凭借写入本书的“寻宝者思维”“踏脚石模型”“新奇性探索”等具体思维方法,在人工智能研发领域取得了飞跃式的突破和进展,产生了一系列惠及人类的伟大创造。

近期我将会在网易号平台将这本书的各个章节分享给大家,感兴趣的网友可以去买一本实体书。

《为什么伟大不能被计划》第七章:解开禁锢教育的枷锁

为了证明美国正在进步,你可以展示各种各样的证据:学校的考试成绩、犯罪统计率、逮捕报告,或其他可能让政治家顺利当选、让普通职员获得晋升的任何东西。在制定了此类统计标准之后,机构中的许多人就会绞尽脑汁地想办法让它看起来有进步,哪怕实际上根本没有。——大卫·西蒙(David Simon)

本书的开篇曾指出,我们主流文化中几乎所有的事情都以目标为导向。目标在生活和工作中如此常见,以至于人们很少质疑目标的必要性。不过现在我们已经知道目标可以轻而易举地欺骗我们。同时,图片孵化器网站和新奇性搜索这两个案例告诉我们,在摆脱目标的束缚后,反而能探索到更好的结果。然而,目标依旧带来了深远的负面影响。我们将在接下来的两章探讨目标是如何影响现代生活的。表面上看,目标似乎推动了人类社会向前发展,但实际上我们为此付出了高昂的代价。

在这一章中,我们首先要回答,对目标的日益迷恋会给社会造成怎样的危害?人们或许普遍存在这样的直觉,即不间断的民意调查、评估并依赖目标导向的标准,往往会使一件有创造力的东西逐渐失去“人性”,变得机械化。当然,如果忍受这些“副作用”意味着能带来更好的结果,或许人们也可以勉强接受这些标准,并把它们当成获取进步必须付出的代价。但事与愿违,当社会的衡量标准被设定为明确的基准时,结果往往会更糟。因此,如果没有更好的结果作为回报,一味执着于“存在缺陷”的措施,不仅不会带来什么好处,反而会造成严重损失。

接下来,为了具体地说明社会为此付出的隐性成本,本章的大部分内容将更详细地研究社会的一个关键功能:教育下一代。我们将看到对目标的痴迷如何引发了当前教育中令人不安的趋势,比如一味地关注标准化考试和剥夺教师的自主权,等等。当然,目前的趋势也可以被扭转。我们将看到非目标思维如何在探索未知、人的多样性发展和激发创造力这三方面为教育带来全新的视角。

首先,是否有明确的案例表明,确立一个社会总体目标弊大于利?事实上,已有大量的科学证据表明这种情况经常发生。例如,本章开头的引言就呼应了社会科学中众所周知的坎贝尔定律(Campbell's law) :任何量化的社会指标,越是被用于社会决策,社会腐败的压力便越大,也就越容易扭曲和腐蚀它所要监测的社会进程。

换句话说,类似学业成绩测试这样的社会指标,当其目标是“让成绩更上一层楼”时,效果往往是最差的。原因在于,单一的指标很难把握人们真正关注的是什么。例如,以学生的考试成绩为标准来评估教师,会直接迫使教师开展应试型教学 ,而最终的结果,不是培养出具备丰富知识和实用技能的学生,而是产出擅长记忆和考试的应试型学生 。以考试成绩为目标时,学生的成绩可能会提高,但同时也意味着他们真正掌握的实用知识反而变少了。关于教育领域的目标导向实践,还有很多值得一说的东西,我们将在本章的后面部分更深入地探讨。

但任何“高大上”的社会追求,最终都会面临同样令人沮丧的悖论。当社会对进步的追求被打包为一种措施进行衡量时,就会产生目标驱动效应。如果目标十分“高大上”,那么提升目标表现的驱动力很可能产生欺骗性,反而阻碍了人们发现最佳结果的能力。以国内生产总值(GDP)为例,这是衡量国家生产力的一项国际通用标准。每个国家都希望最大限度地提升GDP,因而“GDP最大化”就成了国家层面的一个目标。但GDP的增加,并不意味着保持当前的经济政策一定能够继续提升GDP。因此,经济发展可能会陷入一个“中国指铐”式陷阱——需要来一招“以退为进”才能够获得更大的增长。事实上,经济学家们已经意识到,过度依赖GDP没有意义,即使它是全球各国广泛采用的经济指标。这种悖论也被称为“GDP崇拜主义”。

就像考试成绩一样,GDP这类指标越是“金玉其外”,反而越会变得“败絮其中”。究其原因,GDP是如此单一的衡量标准,它并不能真正反映健康经济体的真正内涵。一名善于玩弄权术的政客为了寻求连任可能会制定一些政策来在短期内大幅提高GDP,但从长远来看,这些政策对经济是有害无利的。这类问题恰恰说明了通过单一指标来制定国家政策的危险性——它们很容易导致欺骗。

坎贝尔定律的一种更有害、更极端的形式是不当激励,即有时为了使事情变得更好而选择的奖励或措施,实际上会使事情变得更糟。例如,印度受英国殖民统治时期,英国政府为了消灭毒蛇出台了一项政策:印度公民每上交一条死蛇,就能领取一笔报酬。但这项措施并没有达到预期的效果,反而导致印度公民为了获得赏金而争相饲养眼镜蛇,然后杀死它们牟利。最终,印度的毒蛇数量增加了。因此,这项激励政策产生了与预期背道而驰的效果。同样的事情也发生在越南首都河内,但抓捕的对象不是毒蛇,而是老鼠。这最终导致了老鼠养殖场的出现,而非鼠害问题的减轻。

其他不当激励的例子还有很多:旨在减少酗酒或吸毒的运动,可能会导致危害性更高的药物逐渐泛滥;为工人发现的每块恐龙骨碎片支付报酬,会导致工人选择砸碎整块骨头以获取更多奖赏;为提高企业收益而给高管支付奖金,会导致带来长期隐患的短期逐利行为。这些例子表明,目标的欺骗并不局限于算法和进化领域,而是无处不在,遍及各行各业。这在很大程度上,成了危害日常社会健康的疑难杂症。我们需要了解的是,对目标的盲目崇拜对社会的危害有多大,以及我们能做些什么来改变现状。

当研究和探讨的对象是人类社会时,我们应尤为小心谨慎,因为这样的情况已经超出了日常生活的范畴。在线图片培育网站上的一个发现,最终会影响到整个社会的文化行为;国会也不会根据数学理论领域的最新突破来立法;理论科学的研究成果很少被应用到社会批判中,至少在谷歌搜索之外的领域很少见。但不知何故,它们在目标方面的交集却出奇地自然,也许这是因为对成就的追求是人类刻在骨子里的天性,即使是科学家也在研究成就与探索。

在本书,我们一直研究的是探索和发现的逻辑。当然,追求任何有价值的目标都必须遵循某种内在逻辑。但在某些情况下,这种逻辑非常脆弱,已经普遍被人们否定了。比如在教育领域,对标准化考试的过分执着,会导致老师和学生只专注于提升应试技巧和死记硬背的能力。在其他情况下,这种逻辑更微妙,更少被公众探讨。最大的危险在于,当逻辑被包裹在一个崇高的目标中之后,其立即具有可信度,跻身不容置疑的崇高地位。这时候对衡量进展或评估计划成功的可能性等文化主旨提出疑问,可能就成了毫无意义的激进做法。毕竟,谁会反对评估呢?

但我们已经意识到,目标是有问题的,而且这个问题并不会因为它们被嵌入人类的美好愿望而突然消失。与此同时,当目标驱动的追求没有效果的时候,非目标驱动型的探索却常常有效。因此,我们已经到了有权质疑传统意义上不可置疑的存在(目标)的关键时刻。这种逆向思维毫无疑问很有趣,但同时我们也要尽量保持谦逊。我们的目的,不是要谴责现代社会的整个基础。正如前文指出的那样,目标不是,也永远不会是无用的。它们在追求日常的成就时发挥着重要作用,并将在未来继续发挥作用。但我们在此谈论的不是那种日常生活中常见的、能轻易达成的成就。

相反,我们正在研究那些人们为创新、发现和创造而努力的细分区域。换句话说,我们对远处笼罩在迷雾之中的湖对岸的风景颇感兴趣。由于创造力是人类最重要的能力,我们几乎可以在任何领域看到这类努力,从小学或研究型大学的教室,到投资者的投资组合,甚至在我们自己内心。但是,虽然我们几乎在任何地方都能发现创造力和创新,但探讨一些特殊的例子,以说明非目标导向的思考如何能带来直接影响社会的效果,是很有帮助的。为此,我们将在本书第八章重点讨论科学、商业和艺术领域的人类创新,而本章接下来的内容将专注于对教育领域的探讨。

想要质疑或挑战社会对待教育的态度,让我们首先看看社会对那些所谓“无所事事”的年轻人的刻板印象:对未来没有规划明确的道路,没有具体的目标。你可能认识这样的人,或者你自己就是这样的人。这当然不是值得学习的榜样。要想振作起来,你需要一个计划和目标,然后全心全意地追求这个目标的实现。但遥远的职业理想本身,不就是值得追逐的“高大上”的目标吗?从跻身青少年荣誉榜单到成为伟大的发明家之间的步骤,充满了不确定性。如果你一开始就为未来的某个职业目标而奋斗,并让这种追求引导所有的决策,那么你迟早都会掉进目标的欺骗性陷阱(就像追求任何其他“高大上”的目标那样)。当然,你最终可能会拿到一个工程硕士学位并在一家颇有声誉的公司工作,但如果这就是你此生达成的全部成就,那么你其实并没有如儿时梦想的那样成为一名伟大的发明家。

如果你从头读到这个章节,或许已经知道如此这般的原因。这不是目标过于高远,或你个人不够努力的问题,而是目标的欺骗性问题——因为那些通往伟大发现的步骤(踏脚石),看起来与那些伟大发现毫无相似之处。换句话说,你在用错误的指南针导航。同时,我们已然发现,往往没有设定具体目标的探索,反而能够带来更有趣的结果。奇怪的是,如果你效仿了那些“胸无大志”的青年,反而有更可能接近伟大的发明家(或伟大的建筑师,或伟大的作曲家)的境界。这是因为无所事事的年轻人可以扮演“寻宝者”的角色,在摆脱了既定目标的束缚之后,他们可以勘察各种类型的踏脚石,从中选择自己最感兴趣的去尝试和探索。只要不是从起点就开始限定前进的路径,我们就能够探索不同类型的踏脚石,追寻当下最感兴趣的东西。没有设定目标的人,反而有机会嗅到路旁的玫瑰花香(享受常被他人忽略的美好事物)、广泛地涉猎不同领域的知识;而那些只专注设定每日任务清单,致力于完成清单列出的每一项内容的人,反而失去了这种“邂逅最美意外”的机会。

如果你接受“目标作为指南针是一个错误”这一理念,那么很多常见的假设,例如所谓的“人无目标不立,事无目标不成”,就开始站不住脚了。当然,故事从来都不是非黑即白的,因为漫无目标并不总是一件好事。但如果将漫无目标与对探索的渴望相结合,可能激发巨大的潜力。在看过这么多没有设定明确目标,反而带来伟大发现的案例之后,我们或许开始明白其中的缘由。理解了这个观点之后,再回过头看史蒂夫·乔布斯的成功故事就非常有意义了。乔布斯将个人经历描述如下:

而六个月后,我却看不到其中的价值所在。我既不知道这辈子想要做什么,也不知道上大学是否能帮助我找到答案。但是在上大学一事上,我几乎花光了我父母这一辈子的所有积蓄。所以我决定退学,并相信一切都会有办法。我当时确实非常害怕,但是现在回头看看,那的确是我这一生中做过的最棒的一个决定。在我退学的那一刻,我终于可以不必去学那些令我提不起丝毫兴趣的课程了,然后我还可以去修那些看起来有点意思的课程。

这是否意味着每个人都应该从大学辍学?虽然答案是否定的,但这个故事确实暗示着,或许没有计划反而是一个非常好的计划。如果辍学是为了探索有趣的东西,寻找最有前途的踏脚石,那么辍学的策略就同报医学预科班并于期间修完所有必修课一样有效。尽管乔布斯说,他不知道自己想做什么,但他恰恰做了自己想做的事,那就是去探索无限的可能。只不过,在我们的文化中,没有明确目标的“探索”,似乎是有缺陷且具误导性的,甚至连乔布斯也不敢肯定地为其“美言一二”。在没有那些常见的里程碑节点和计划的重压下,谁能预测下一代人会有什么伟大的发现呢?

像乔布斯这样秉持开放式思维的开拓者,他的成功故事表明,我们在放弃沿着传统的高等教育之路前行后,仍有可能获得成功。但更重要的是,这种故事同样反映了目标思维给整个教育带来的深刻阴影。就这一点而言,教育就成了一个容易受到“目标化”影响的领域。因为教育对评估的严重依赖,实际上都是为了追求各种目标的实现。整个教育系统充斥着许多类型的评估,挑出一些最具代表性的案例不过是小菜一碟。例如,我们都知道,儿童时期不间断的(学业成绩)测试可能会扼杀孩子们的创造力。但是,与其选择这些简单的目标,不如让我们更深入地看看人们对目标的盲目崇拜,是如何潜伏在这种被普遍接受的教育实践背后的。与其考虑学业测试对学生的影响,不如思考一下如何以及为什么要根据标准化测试的结果来评估学校本身。

评估是当前教育领域最常用的衡量手段。标准化测试不仅被用来评估学生的课业表现,还被用来评估学校教育的成功与否。通常情况下,人们希望这些针对学校的评估,将有助于获得理想的结果,其本质就是实现各种类型的教育目标。例如,2008年美国教育部给佛罗里达州教育局局长发了一封信,信中讨论了佛罗里达州在实现《不让一个孩子掉队》这项教育法案所列目标方面的进展:

年度可衡量目标(AMO)[为使学校满足“适当年度进步”(AYP)的目标要求而规定的,获得优异成绩的学生人数百分比本年度目标]:

·2008—2009年,佛罗里达州的目标是:65%的学生在阅读/语言艺术方面取得优异成绩,68%的学生在数学方面取得优异成绩。

·年度可衡量目标的类型:佛罗里达州根据法定要求制定了年度可衡量目标,并根据不同年份情况进行了调整,这意味着年度可衡量目标每年以等额的方式增加 ㊟。

请注意,这里强调了非常具体的、可衡量的目标。我们可以将这种方式,看成佛罗里达州给自己设置了许多推动教育进步的踏脚石。例如2008—2009年的踏脚石,就是65%和68%的优异成绩率,并且下一年的比率还可能进一步提高。佛罗里达州希望可以通过这些数据的稳步上升,实现其长期教育目标:几乎每位学生都能取得优异的成绩。这背后的假设是,成绩的提高,表明学生正朝着未来接近完美的“高大上”目标迈进。但请注意,同样的假设也导致我们的手指卡在“中国指铐”陷阱里动弹不得,即通往自由的路径,永远不会经过一些看起来不那么自由的地方。这与目标驱动型搜索背后的道理是一样的,也就是认为提高目标的表现能够照亮通往重点目标的正确道路。

但是,在谈论教育这样重要的社会支柱时,要求人们承认目标导向型思维的不足之处可能十分困难。但如果提升与特定目标相关的表现不是取得成功的正确途径,那么我们要怎么做才能够确保“自己对自己负责”呢?我们希望这些简单的、基于目标进展的衡量标准能够告诉我们,一位教师或一所学校是否做得很好,这样我们就可以奖励那些成绩提高者,惩罚那些成绩下滑者。但不幸的是,问题越复杂,目标导向的思维就会越乏力,而教育无疑是一个非常复杂的社会问题。因此,尽管没有哪位态度严谨的教育专家会认为教育是一个简单的问题,但在教育领域应用目标导向型方法需要设定前提。只有在问题简单的情况下,通过目标来推动进步才是有意义的做法。但显然,教育并不属于这个范畴。

因此,我们也没有理由认为,教育领域的“高大上”目标,在某种程度上可以免受目标的欺骗性的危害。尽管这听起来有违常理,但一个班级的学生在某次考试中的分数高于去年,可能并不会比他们的分数低于去年更好——尤其是在考虑到学校未来的光明前景时。这是因为通向真正的、近乎完美的全班表现的踏脚石,很可能与任何常见的教育衡量指标毫无关联。各种测试驱使每个学生取得更好的成绩,这些成绩代表了人们期望的理想结果(即目标)。但我们已经看到,这几乎是一条注定行不通的死胡同。换句话说,试图通过衡量成绩来实现任何远大的教育目标,都是自欺欺人。这也就是说整个伟大教育事业的追求过程,完全基于对目标的盲目崇拜。这就是为什么我们需要意识到,在由目标驱动的成功中,隐藏着欺骗性的暗流。这种欺骗性甚至会影响到整个社会层面的努力,并且人们可能在很长一段时间内都意识不到它造成的伤害。

比如,在软件工程领域(开发新软件的行业)发展的早期阶段,也曾出现过类似“一切皆可测量”的风潮。许多人尤为关注具体测量标准带来的前景,期望以此提高生产力和软件质量。汤姆·狄马克(Tom DeMarco)在1982年写了一本颇具影响力的书,描述了这一风潮的特点,其中最有名的一句话是“无法测量的东西,就是不可控的东西”。35年后,狄马克又发表了一篇文章,表示自己的观点已经随着时间的推移发生了转变。“那本书想要表达的言外之意其实是,‘衡量标准是好的,更多就更好,越多就越好’;但最终事实证明,‘它们的使用,反而应该谨慎而节制’。”因为,对由数百万行代码和无数相互作用的部分组成的更复杂的软件而言,“一刀切”的简单衡量标准将变得毫无价值。在同一篇文章中,狄马克写道:“尽管衡量标准使我们能够对进程施加控制,但严格的控制只适用于那些没有潜力产生重大影响的项目。””换句话说,只有在目标相对平凡的情况下,衡量标准才是有用的。如果我们将其应用到宏伟事业上,就会使其失去其价值。在软件开发领域,对衡量标准的盲目推崇,导致工程师们被迫不断抬高衡量标准,哪怕他们知道这些衡量标准已经日益与现实脱节——这种盲目追逐目标的主导性风潮,在持续多年之后才开始消退。目前,美国的教育系统可能正在上演同样的、盲目推崇“一刀切”目标衡量标准的错误。但这一次,受到自欺欺人式成就衡量标准束缚的对象,从软件工程师变成了儿童和教师。

问题是,目标的欺骗性不仅会损害教育这样的伟大事业。在其他类型的社会事业中,基于目标的思维也可能会带来不易察觉的破坏。例如,最近关于推出问责制的言论甚嚣尘上,即通过更加精确的评估标准来改进评估的效果及其达成的程度。以奥巴马政府出台的“力争上游”(Race to the Top)教改计划为例,美国教育部就反复鼓吹和兜售其准确性:

在美国《复苏与再投资法案》(ARRA)的授权下,“力争上游”评估项目为各州联盟提供资金,以开发有效的评估框架,为教学提供支持和信息,提供关于学生知道什么和能做什么的准确信息,并以“确保所有学生获得在大学和职场取得成功所需的知识和技能”为标准,来衡量学生的成绩。

高等教育也同样正朝着评估驱动式文化的方向发展。新型测试已经出台,如美国大学生学习评价(CLA)和美国大学学术能力评估(CAAP) 。这些测试的目的,也是为了提供关于大学生学业进步和学习成就的准确描述。

然而,准确性也同样存在一个与目标神话有关的问题。在一个由目标驱动的追求中,准确性并不一定有助于提高学业表现或成绩。如果你是“推动评估朝着更准确方向发展”这一方案的参与者,那么前一句话听起来可能有点“忠言逆耳”了。但好的一面是,如果准确性不能解决“高大上”目标导致的问题,那么我们至少可以把资源转到更有可能解决问题的地方。

你可能还记得在本书第三章中,由图片孵化器网站用户“繁育”出来的骷髅头图片。这是一个有趣的例子,因为它可以帮助我们理解,为什么准确度不能成为解决问题的方法。真正有趣的地方在于哪些踏脚石图片实际上帮助培育出这个骷髅头图片(见图7.1)。很重要的一点是,它们中的大多数看起来都不像骷髅头,其中一张图片是月牙形,另一张看起来像甜甜圈,还有一张类似于盘子。因此,为了“繁育”出骷髅头图片,用户首先要发现这些看似不相关的图片。

注:这些步骤(从总共74个步骤中抽出)追溯了图片孵化器网站上骷髅头图片的起源,直至其最原始的本源图片。

想象一下,我们在全美范围内,发起了一个从头开始“繁育”骷髅头图片的运动。“美国骷髅头培育部”为鼓励培育的进度,制定了严格的评估标准,并规定对“繁育”出的每一张图片,都要进行最细致的精准性评估。为了满足评估的需求,一个由世界顶级骷髅头评级人员组成的小组,制定了一套先进的测试手段,以0~100分的标准,评定所有候选图片在“骷髅头相似度”方面的得分。有了这个高度精准的测试作为保障,美国现在可以放手开启一个培育骷髅头图片以及骷髅头相似性图片的新时代。新培育的图片,如果在骷髅头相似度测试中得分不高,显然应该被抛弃;而那些得分较高的图片,显然应该被进一步培养。

不幸的是,我们已经知道这种做法最终会得到什么结果。如果我们足够幸运,它可能会带来一些有趣的结果,但肯定不会是骷髅头图片。如图7.1所示,看过生成骷髅头图片的、具备踏脚石性质的图片,你就能清楚地意识到,为什么这个方法永远都不会取得成功——因为这些踏脚石性质的图片,看起来跟骷髅头毫无相似之处。因此,无论我们能够多么精准地评估“骷髅头的相似度”,这个方法都不会产生效果。因为通往骷髅头图片的、具备踏脚石性质的图片,无论如何看起来都不像骷髅头(事实上,我们已经通过奖励骷髅头相似度的实验证实了这个结论,这些以相似度为标准的实验,无一例外地遭遇了失败)。这个方法的问题在于,我们要比较或评估的东西(骷髅头)看起来与通往骷髅头图片的踏脚石(月牙形、甜甜圈和盘子形状)完全不同。因此,当我们以一项存在根本性错误的方针为指导时,再多的准确性对我们都毫无用处,因为其结果不过是更好地评估了通往正确道路的干扰因素,而非真正的踏脚石。

除了图片孵化器网站上的骷髅头图片之外,正如我们在本书前面的章节中反复看到的那样,这是探索及发现的一个普遍属性,即通向伟大成就的踏脚石,与其最终的成就并不相似。就好像真空管长得不像计算机,扁形虫与人类也没有什么共同点。所有这些例子,一如既往地都可以归结为复杂的探索空间中的同一类欺骗性故事。

毫无疑问,确保整个国家的学生都接受过特别良好的教育,是一个比“繁育”骷髅头图片复杂得多的问题。同理,教育评估也不可能从精确度的日益提升中获益:评估只是衡量目前的表现与理想的表现相比有多好。就像骷髅头图片或本书第五章中走迷宫的机器人一样,无论评估精度如何,其结果都可能是迅速地转进一条平庸的死胡同。为此,我们可以得出一个有悖常理的结论,即在这类问题上,评估的准确性并不重要。虽然这听起来很奇怪,但如果你意识到,目标性本身有时会产生“适得其反”的效果,或许就可以理解这一结论了。在这种情况下,准确性当然不再具备实际的指导意义。

除了对精准测量的错误信任外,基于目标导向型思维给教育领域带来的另一个长期伤害,是对“一刀切”的统一标准的追求。其背后的逻辑是,无论身处何处,每个学生都应该有机会获得相同类型和同等质量的教育。其背后的驱动逻辑是确保教育的公平性,即生活在美国东北地区的学生,应该接受与生活在西部或南部的学生同等的教育。换句话说,各地的学校应该在教给学生什么样的知识上,遵循统一的标准。这样一来,无论住在哪里,所有的学生都能学到相同的知识,并且能在高中毕业后,为进入职场或下一阶段的高等教育做好同等的准备。

全国各地的学校以不同的方式执行同一个教育理念,可以定期对学生的表现进行统一评估。这样一来,我们就有了适用于不同地区的国家统一标准,以及许多具体的衡量标准,用以反映学生个人和他们的教师在其学业或职业生涯中的具体进展。因此,如果某个地区的学生接受的教育质量较差,或者某所学校的教师表现不佳,人们就很容易发现问题。这一举措背后的逻辑是,全国统一的评估,可以帮助确保教育平等,更清晰的横向比较也可以提高评估的严格程度。

推动全国教育统一标准的一个例子,就是美国“共同核心州立标准”(CCSS)。该标准由全美州长协会(包括其他机构)发起,与华盛顿成就公司(Achieve,Inc)合作制定。CCSS的主要目标,是建立一套统一的国家教学标准,以及一套与之匹配的定期和统一的评估体系。尽管仍存在争议,但美国绝大多数州已经采用了CCSS,问责制、标准量化和统一性等方面均得以进一步强化。虽然这种统一性表面看起来可能是有益的,但隐藏在光鲜表象之下的,就是我们熟悉的目标神话的谬误。

事实上,CCSS的一个明确功能是设定各种教育目标,正如CCSS网站上的常见问题板块表明的那样,“通过为学生的学习提供明确的目标,教育标准旨在帮助教师们确保学生拥有通向成功所需的技能和知识。”当然,如果我们不能时常准确地衡量各项目标的进展来使之保持统一,以便于进行普遍性的横向比较,那目标又有什么用呢?出于这个原因,CCSS也帮助“开发和实施共同的综合评估系统,用于每年衡量学生的表现,以取代各州现有的、不统一的测试系统”。

尽管我们可以轻易地理解推动统一教育标准背后的良好意图,但在这一点上,我们也能看到,目标的误导性是如何破坏这件“美事”的。统一标准很像前文提及的准确性问题,它是评估和测量的一个好帮手,但却是教育领域“寻宝者”的劲敌。

一个彻底统一的教育系统,能从细枝末节之处确保每个学生拥有平等的经历,但其意义不大。学生们的课程、学业目标和测试都是一模一样的,这种“一刀切”的统一性,尽管可能通过增强的目标感和科学性给人带来安全感,但与提升孩子们的教育质量没有必然的联系。无论选择什么样的统一标准,都有可能带来好的或坏的结果。当然,制定一套劣质的统一标准,必然会让情况变得更糟。即使我们选择了最合适的统一标准,并且反映了当前最佳的教育实践,这些当前最佳实践也可能根植于目标的神话之中。

我们不妨这样推理,无论CCSS提议学校采用何种标准化测试程序,由此产生的简单统计数据,是否会指明通往世界顶级教育的道路?如果我们认为,通过标准化考试来衡量并促进教育进步是一项整体错误的指导方针,那为什么要专注于更“千篇一律”地应用这项错误方针的某个特定版本呢?这样做的唯一结果是,全国各地的学生都会被完全相同的误导性测量方法评估(即使测量方法十分准确,它也不会引领我们通往最终的目标),而各地的教育实践,即便采取了不同的形式,也会以实现相同的欺骗性目标为目标。因此,除非我们能够确信已经找到了正确的终极方案解决教育这个极其复杂的问题,否则汇聚到一起的尺度和目标,就好比是另一块失灵的指南针,只不过这一次,它被重新打上了“黄金标准”这一闪亮的标签,得到了所谓的官方认定。然而,与前文追求精准性的实践一样,追求教育的统一性,不过是目标欺骗性的又一案例。我们从中得出的教训是,一个存在误导性的测量工具,并不会因为变得更精准或被普遍采用,就能够实现完善或改进的结果。

然而,强加的教育统一性可能会造成更多不易察觉的“内伤”,因为除了没有任何内在的益处之外,统一性还会损害孩子们在未来探索和发现的能力。执行统一的标准意味着向一个单一的标准聚合,同时也消灭了个别学校或个别州目前可能正在探索的其他标准的多样性。因此,未来的标准和测试,可能只是对强制实施的现有标准的调整,因为这是教师们在课堂上可以应用和探索的唯一标准。

我们可以将教育标准领域这种缺乏多样性的探索,与本书第五章中描述的新奇性搜索算法联系起来。当单一的进度衡量标准,被统一应用于搜索能够通过图5.2所示的迷宫的机器人时,可能会迅速导致整个实验陷入一条欺骗性的死胡同。但是,如果实验鼓励创新,同时鼓励探索许多不同的成功可能性,其结果就是不断地发现新的解决方案。当然,回到教育领域,我们可能并不希望国家鼓励任何疯狂的新尝试。比如,实验一下在考试当天给学生发棒棒糖,是否能够提高美国高中毕业生学术能力水平考试(SAT)的分数等。但我们可以希望教育政策能够给予教师们更多的自主权,让教师们根据自身丰富的实践经验和本能,探索促进深度学习以及使学生加深对教材理解的方法。

本书第三章中图片孵化器网站上的骷髅头图片的演变,也反映了同样的逻辑。如果没有不同的用户遵循各自不同的喜好开展多样性探索,像骷髅头这样的图片或许根本不会被发现。如果“美国骷髅头培育部”,也能够允许不同的研究人员自主设计,并遵循自己的骷髅头相似度标准,也许最终获得成功的概率更大。更好的做法是,允许研究人员遵循个人对什么东西可能最终生成骷髅头图片的直觉,并以此去设计、实践、探索。

当然,这个见解并不意味着鼓励多样性可以解决追求实现任何特定类型的“高大上”目标的难题。因为这种说法,不过是从一个不同的角度,再度陷入目标欺骗性的陷阱而已。不过可以肯定的是,扼杀多样性必然会减缓探索和发现的进程。因此,我们可以发现,统一性可能和准确性一样,是一种毫无意义的理想标杆,尤其是在我们设定了教育优化等远大目标的情况下。

谈到教育,这是一个影响到全社会的问题,每个国家都在努力寻找行之有效的方法来“教化育人”。教育问题如此复杂,以至于人们几十年来都没有找到一种“一劳永逸”的解决方案。为此,我们必然要思考一个问题——非目标思维对教育意味着什么?到目前为止,本章就教育领域的论述,遵循的是一种熟悉的模式,即目标导向的方法成为目标欺骗性的牺牲品,使关于“如何取得进步”的传统设想变得岌岌可危。但我们同样熟悉的是,如果我们能够设法摆脱只考虑目标的做法,教育事业就能再次获得一线生机。有时也许应该允许广大教师和学校系统遵循其本能和直觉,哪怕他们在评估中的得分连年下跌。但是,随着“应试教育”的流行和“力争高分”等目标压力的增加,对这种“直觉”的依赖显然受到了压制,其结果是教师们大部分的自主权、直觉和创造力被剥夺,教师们对教学的热情和初心也被慢慢耗尽。

或许,我们最好将投入评估方面的精力转移至尝试不同的想法,而不要过分强调衡量标准的精确度。这将使教师们能够充分利用其多年来在与学生的互动中磨炼和积累的创造力和近乎直觉化的专业知识,让他们去自由地探索更有潜力的路径。就像在图片孵化器网站上一样,多样性探索产生的一些想法可能注定要失败,但另一些则可能带来有价值的发现,而整个体系(就教育而言,是整个社会)将会同时从不同的路径和尝试中受益。那些看起来有趣或有前途的方法,会成为通向成功的踏脚石,其他人可以在此基础上继续探索和发现。通过这个方法,整个社会就能成为教学方法的“寻宝者”。但是这种对不同可能性的有益探索,可能会受到当前僵化的、以目标为导向的主流文化的排斥,至少在美国会这样。(以芬兰的小学教育系统为例,它为芬兰的教师们提供了更大的个人自主权,并且不会要求学生参与标准化的测试。在这个意义上,芬兰的教育系统,更多遵循了非目标的探索精神。所以,芬兰在教育方面也处于世界领先地位,远远超过了美国。)

同样有趣的是,美国高等教育最近才开始接受与小学同样的“基于准确性评估的问责制”。在此之前,其长期以来一直被认为领先于全球水平。反观美国的小学教育,长期以来走的都是“目标性和统一性”的路子,其落后于全球水平的事实,也同样全球闻名。所以说,有时候过于强调目标,反而是非常危险的做法。

批判这种以目标为导向的追求,可能会造成一个令人沮丧的事实,即替代方案可能看起来模糊不清。但随着这本书的深入,我们现在已经非常熟悉这种不相信和怀疑自己的时刻。在审视伟大的事业追求与失灵的目标指南针相互博弈的过程中,我们经常会遭遇此类自我怀疑的时刻。最终我们会到达某个临界状态,即“船到桥头自然直”,意识到不存在明显可替代现状的方案。这种持续的质疑和挑战,是一个有趣的过程,但突然之间,我们又开始渴望熟悉的目标思维,因为它可以带来舒适感和安全感。问题在于,一旦我们发现了目标导向型思维存在的根本缺陷,就会有一种“突然跻身于一个充满不确定性的世界”的感觉,并失去了习以为常的方向感。所以,对于大多数人而言,追逐更好的目标成绩、评估的准确性和统一的标准,至少能够为改善教育提供一些方向,哪怕这些都是有缺陷的做法。

但只要正视一个简单的事实,就可以再次让我们克服迷失方向的恐惧感。我们不需要通过设置目标来实现伟大的事业;不需要追求最佳的表现或完美的准确性,也能够寻得惊人的发现。就像我们在本书第五章中舍目标而取新奇性那样,放弃目标也并不意味着我们没有任何原则。我们只是开始运用不同的原则,以期更好地反映发现和探索的真正运作方式。

要记住的关键原则是,替代目标欺骗性原则的是“寻宝者原则”,而寻宝者要做的事就是收集踏脚石。因此,当我们投身于像教育这样牵涉到整个社会发展的伟大事业时,如果我们作为社会的一分子,能够帮助彼此探索通往新理念的不同踏脚石,就可能会取得良好的进展。事实上,与其采用不同的评估标准,不如将教学组织成一场致力于寻找最佳的教育方法的“大型寻宝活动”。

那么,我们到底应该怎么做呢?我们也许需要让大多数教师和学校停止对学生进行标准化测试。取而代之的是,每位教师都要在年底编制一套包含作业、测试、教学大纲、教学理念、教学方法和学生作品样本在内的合集。这套合集将被匿名寄给一个评审小组进行评估,小组成员是来自全国各地不同学校的五位教师。评委会从课程完整性、创新性和学生表现等几个方面对教师同行的工作进行评估,评估的结果由评分和书面评语构成。评估完成后,提交合集的教师会收到五份匿名评估。如果经不同衡量标准评判过后的平均得分低于及格线,那么只有在这种情况下,该教师教授的学生,才有可能需要在下一年参加标准化考试,以确保其学业表现不至于太过差劲。如果评分都合格,那么评估结果就是科学的结论。尽管在批判标准化测试这种评估手段之后,立即提倡另一种形式的评估看起来很奇怪,但我们批判的并非评估本身,而是当下流行的特殊评估方式(统一的标准化测试),即与追求远大的教育目标相捆绑的“一刀切”评估。

从避免目标欺骗性的角度来看,这种同行驱动型评估方法的吸引力在于,教师和学校比较的对象或标准,不再是“我们希望他们可以达到某种水平和高度(这就陷入了目标的欺骗性陷阱)”,而是根据“他们的现状进行评估(这是寻宝者的哲学)”。最重要的是,如此一来,整个教育系统就好比是一位寻宝者,因为它将完全专注于四处传播新的教育理念。教师们也不会被迫趋向于采用沉闷又刻板的应试教育方法,而是能不断地接触各种各样的教学想法和方法。之所以会出现这种改善,是因为教师们每年都要参与不同小组的评审,收到其他人给自己的评价和反馈。因此,教师将不断地看到其他教师的教学方法及其成果,并推敲背后的原理。这样一来,他们自己可以在下个学年的教学中,尝试自己上一学年了解到的最佳教学方法和实践,并可以在这些方法的基础上进一步探索和拓展——这就意味着他们跳到了下一块踏脚石。寻宝者获得了探索的自由,且教育质量依然有保障,教师们可以充分释放创造的潜力,而孩子们花在准备无休止的标准化考试上的时间也会减少。

要解决教育领域的复杂问题,没有一蹴而就的简单答案,我们也不会假装能够提供任何类似于“解决方案”的东西。本章的重点是要说明,类似教育这样牵一发而动全身的重大事业,如何犯下本书第五章中,导致机器人走进死胡同那样的错误,以及寻求某种可替代的解决方案仍是有希望的。也许并不存在一种目标导向型教育方法,可以教给每个人我们希望他们能拥有的每一种技能。承认这一点虽然会令人不快,但这其实与指出其他领域内任何“高大上”目标的欺骗性事实并无不同。从长远来看,伟大的事业之所以能够达成,并不是因为设定了目标,而恰恰是因为没有既定的目标。对于那些希望通过强制性标准推动进步的人而言,这是一个令人失望的结论;但对于其他人来说,这可能是一种启迪。在下一章,我们将继续秉持这种解放思想的精神,研究在追求创新的过程中目标所产生的破坏性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美防长“飘了”,先嘲讽俄罗斯,再将矛头对准中国

美防长“飘了”,先嘲讽俄罗斯,再将矛头对准中国

空天力量
2026-01-10 20:07:38
让白宫心惊肉跳!中方推出星链终端干扰设备,而且大大方方展出!

让白宫心惊肉跳!中方推出星链终端干扰设备,而且大大方方展出!

我心纵横天地间
2026-01-08 22:42:39
马杜罗被绑后,加拿大总理立刻访华,行程安排比李在明还有求生欲

马杜罗被绑后,加拿大总理立刻访华,行程安排比李在明还有求生欲

梁讯
2026-01-11 04:37:10
霍启刚公布个人名下财产!全球共有35个物业,收租颇丰生活却节俭

霍启刚公布个人名下财产!全球共有35个物业,收租颇丰生活却节俭

阿纂看事
2026-01-10 22:39:19
特朗普宣称“不需要国际法”,联合国秘书长重申立场

特朗普宣称“不需要国际法”,联合国秘书长重申立场

澎湃新闻
2026-01-10 19:57:04
火记:杜兰特没兴趣当超级英雄,火箭若夺冠无望,他可能选择离开

火记:杜兰特没兴趣当超级英雄,火箭若夺冠无望,他可能选择离开

移动挡拆
2026-01-11 05:16:35
国家终于出手!外卖平台的好日子到头了?商家骑手消费者都要笑了

国家终于出手!外卖平台的好日子到头了?商家骑手消费者都要笑了

大道微言
2026-01-10 15:03:13
马斯克成伊朗明星;哈梅内伊咒骂美国

马斯克成伊朗明星;哈梅内伊咒骂美国

跟着老李看世界
2026-01-10 00:02:23
“死了么”APP爆火,冲上榜一!开发者是三个95后,下载需8元,网友建议改成“活着么”!最新回应

“死了么”APP爆火,冲上榜一!开发者是三个95后,下载需8元,网友建议改成“活着么”!最新回应

每日经济新闻
2026-01-10 18:27:07
问题到底出在哪里?为什么那么多人不信官方说法…

问题到底出在哪里?为什么那么多人不信官方说法…

慧翔百科
2026-01-10 13:44:32
佐香园与闫学晶解约

佐香园与闫学晶解约

界面新闻
2026-01-11 09:01:19
多地农民养老金缴费上限迎来新一轮上涨

多地农民养老金缴费上限迎来新一轮上涨

经济观察报
2026-01-10 18:12:08
演员孙涛力挺闫学晶后续:抖音评论区彻底沦陷了,各种调侃他

演员孙涛力挺闫学晶后续:抖音评论区彻底沦陷了,各种调侃他

小徐讲八卦
2026-01-10 14:14:29
中产涌入超市,抢300元羽绒服

中产涌入超市,抢300元羽绒服

中国新闻周刊
2026-01-09 22:13:04
明尼苏达州被击毙的白+左+女同,一场流产的黑命贵

明尼苏达州被击毙的白+左+女同,一场流产的黑命贵

移光幻影
2026-01-10 18:29:50
马布里携妻子观战尼克斯 晒照发文:爱不再是感觉 而是呼吸的空气

马布里携妻子观战尼克斯 晒照发文:爱不再是感觉 而是呼吸的空气

Emily说个球
2026-01-10 12:19:24
闫学晶“哭穷”后多平台账号禁止关注 其代言调料品牌老总:将向她索赔 不再请明星代言

闫学晶“哭穷”后多平台账号禁止关注 其代言调料品牌老总:将向她索赔 不再请明星代言

红星新闻
2026-01-10 14:19:18
人民日报罕见“钟才平”四连评,释放极强政策信号,信息量巨大!

人民日报罕见“钟才平”四连评,释放极强政策信号,信息量巨大!

识局Insight
2026-01-10 13:23:53
28岁,丰满圆润,顶级身材太汹涌了

28岁,丰满圆润,顶级身材太汹涌了

技巧君侃球
2025-12-14 23:49:18
10-1,曼城创下队史足总杯最大分差胜利纪录

10-1,曼城创下队史足总杯最大分差胜利纪录

懂球帝
2026-01-11 01:37:36
2026-01-11 10:00:50
我读我在
我读我在
一起读书吧
358文章数 909关注度
往期回顾 全部

艺术要闻

“天狂有雨”背后的秘密,你绝对想不到!

头条要闻

"国共论坛"被指即将重启 郑丽文:感受到大陆诚意善

头条要闻

"国共论坛"被指即将重启 郑丽文:感受到大陆诚意善

体育要闻

詹皇晒照不满打手没哨 裁判报告最后两分钟无误判

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

科技要闻

必看 | 2026开年最顶格的AI对话

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

健康
旅游
房产
家居
公开课

这些新疗法,让化疗不再那么痛苦

旅游要闻

宁波首座地铁口庭院开放 每逢整点还有人造雪花

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

家居要闻

木色留白 演绎现代自由

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版