网易首页 > 网易号 > 正文 申请入驻

高等教育获得与回报专题|李代、王一真:高考录取中的不确定性与教育获得差异——以X省为例

0
分享至

李代,北京大学中国传统社会研究中心

王一真,北京大学教育学院

摘要

在教育获得差异的研究中,控制考生学业表现之后,如果性别、民族、城乡等变量系数仍然显著,这些差异是什么机制产生的?在二本线以上,差异是由录取中的不确定性驱动的,而在二本线以下,差异是由不同群体考生对不同层次教育的偏好驱动的。本文采用X省完整高考数据,刻画了不确定性的分布情况、不同社会群体应对不确定性的行为差异以及最终对教育获得差异的影响,并探讨了教育扩张等政策对不确定性的影响。本文研究成果有助于打开教育获得差异生成机制的黑箱,为教育获得差异研究带来新的视角。

关键词

不确定性;匹配;高考;教育获得差异

现代社会中,教育扮演着至关重要的角色,教育获得在社会群体中的分布差异直接关系到社会流动的强弱、贫富差距的大小。此前研究主要关注不同群体升学可能性的平均差异。例如,研究发现性别(叶华、吴晓刚,2011;张兆曙、陈奇,2013)、民族(Cherng et al., 2013;李春凯、吴炜,2017)、年龄(刘德寰、李雪莲,2015;张春泥、谢宇,2017)、阶层(吴愈晓,2013a;吴晓刚,2016)、城乡(刘精明,2006;李春玲,2014)等变量均与升学机会相关。平均来看,家庭社会经济地位越高越有助于学生获得更好的就学机会(吴愈晓,2013a;吴晓刚,2016);就教育机会而言,城市学生比农村学生更有优势,而且城乡差异日益显著(刘精明,2006;李春玲,2010,2014;吴愈晓,2013b);尽管性别差异不大(李春玲,2010;邵岑,2015),但研究仍发现农村女性处于较大的劣势(吴愈晓,2012);农村少数民族的教育机会最有限,其次为农村汉族,而城市少数民族和城市汉族都具有优势(李春凯、吴炜,2017)。

现有研究在以下方面仍有进步空间。首先,此前研究多把升学机制视为黑箱,主要关注社会各群体获得教育机会的多寡,而较少关注升学机制安排对教育机会分配的影响。如果将中国升学机制的具体安排纳入研究视野,有助于打开黑箱,对机制有更深入的理解。其次,有些研究未能把研究对象的学业表现纳入研究框架,削弱了研究结果与日常经验对话的能力。个体最关心的是已知自己学业表现之后的升学机会,而不关心整个社会群体的平均水平。

如何将学业表现容纳到现有的研究框架中呢?在中国,初中升高中、高中升大学本科等重要的升学竞争往往以标准化考试成绩为主要依据。李代(2017)假设升学结果完全由考生分数决定,穷举分数线所有可能的取值,并考察了每一个分数线下的城乡差异。如果升学结果完全由分数决定,李代(2017)的假设就能够成立,研究“分数不低于一本线”可以近似估计“被一本大学录取”。

更常见的做法是在准确测量学业表现之后,将其作为自变量放入模型中。如果升学结果完全由分数决定,此时其他社会经济变量理应变得不显著。然而,实际情况并非如此。例如,吴晓刚(2016)控制了高考分数之后,部分模型中性别、民族和家庭经济地位等变量仍有显著影响。这说明在学业表现之外,社会经济变量还通过其他途径对升学结果产生影响。对此可能有哪些解释呢?

首先,高考录取考量的因素不限于卷面分数。国家规定了各种政策加分,并且还有特殊招生计划。有些特殊招生计划设立的目的就是调节教育获得差异,例如民族班/预科向少数民族考生倾斜,国家专项计划向农村考生倾斜,等等。如果高考提档分被放入模型,也就控制了加分政策的效应。此时若其他变量仍然显著,部分可以由特殊招生计划解释。

其次,高考录取还涉及匹配过程中的不确定性。受信息不对称和协同博弈复杂性影响,考生报志愿、被录取的过程存在不确定性。不确定性的一个典型结果就是“落榜”——没能被任何志愿中填报的高校录取。如果不确定性的结果受社会经济变量的影响,也可以解释升学结果的差异。

最后,考生对不同类型教育的偏好存在差别。不同社会经济背景的考生对不同质量、成本与回报的高等教育可能有不同偏好。例如,家庭经济背景欠佳的考生对民办高校的偏好可能就弱一些,因为就读于民办高校的费用较为高昂。

本文关注的焦点是不确定性。对高考录取中不确定性的研究除了学术价值之外,也有很大的现实意义。心理学和医学研究表明,不确定性与人类的压力感、焦虑感有密切关联,越不能忍受不确定性,越容易感到焦虑(Grupe & Nitschke, 2013;Peters et al., 2017)。不确定性给人带来的压力甚至超过了确定的不良结果(De Berker et al., 2016)。升学过程中的不确定性是学生压力、焦虑的重要来源。对不确定性的研究有助于客观认识教育政策的效果,从而提高政策制定的科学性。

一、研究背景

(一)不确定性

“不确定性”描述的是认知不完善的状态。对事实认知不充分、不能准确预测事件的结果,都是不确定性的体现。经济学家弗兰克·奈特将“不确定性”与“风险”区分开来,“风险”中缺失的是可以测量、计算的信息,而“不确定性”中缺失的则是不能测量、无法计算的信息(奈特,2010)。

不确定性源自信息的不充分,因此获取信息能够降低不确定性。贝叶斯统计的基本理念与此一脉相承:人的认知从一定的先验状态开始,被不断积累的经验知识更新,认知中的不确定性也不断减少(Peters et al., 2017)。例如,中学定期举行模拟考试,以测量学生的学业表现,预测其在高考中的成绩。学生据此对其在同期群中的排序有所认知,对升学的结果有所预期。进入到录取阶段后,学生进一步迭代认知,尽可能选择合理的志愿填报策略,以得到偏好高校的录取。本文研究的是在高考成绩已定后,仅在高考录取过程中存在的不确定性。

(二)高考录取的制度安排

抽象地说,招生录取的目标应是将高校与学生的偏好相匹配,越能同时满足双方偏好的机制越有效率。盖尔和夏普利(Gale & Shapley,1962)首先探讨了这一双向匹配问题,给出了一种能提供稳定解的“Gale-Shapley机制”。那么,近年来中国的高考录取又是如何进行的呢?

最近一轮高考改考前,中国大多数省份的高考录取方案是分科、分批、统一录取。所谓分科,就是考生分文、理科目参加考试和填报志愿。分科时除了普通的文史类和理工类之外,还有艺术(文、理)和体育(文、理)等类别。此外,高职(专科)院校的一部分招生计划通过单独考试完成,考试科目与高考不同,不与高考考生竞争。

所谓分批,就是各省根据招生院校的教育质量将其分为提前批、一本、二本、三本、高职(专科)等不同批次执行匹配,考生在填报志愿时也分批次填报。批次之间的划分是有关部门事先给定的,但在某个批次内部,各个高校的受欢迎程度是考生博弈、双方匹配的产物,没人能预先规定高校录取分数线。即便考生在填志愿时知道投档分,但因不知道分数线,也不能确定自己会不会被录取。

所谓统一录取,指的是在高考结束之后,有关部门将考生成绩与志愿、高校招生计划汇总进行集中匹配。决定学生在匹配队列中位置的统一标准是“投档分”或者“提档分”,由学生的卷面成绩加上政策加分构成。覆盖人群最广的加分政策是少数民族加分,此外还有其他的加分项目。新中国成立之初,我国曾经实行分散录取,由各高校分别确定选拔标准并做出招生决定。这一制度有较大缺陷,因此1952年起被统一招生取代(Chen & Kesten,2017)。后文提到的“分数”指的都是包含了政策加分之后的提档分,因此已经把加分政策的效应包含在内。

高考录取的机制还可以从填报志愿和录取规则两个维度进行观察。填报志愿的环节有三种类型,即“考前填报”“估分填报”“知分填报”。三种类型中考生掌握的信息是递增的:“考前填报”的考生只能依据平时表现来预估高考成绩,“估分填报”的考生能根据高考的感受调整预期,“知分填报”的考生直接根据高考成绩进行填报。随着信息的递增,录取中的不确定性逐次降低。聂海峰(2006)指出,考后知分填报志愿在完全信息的条件下总有纯策略均衡,因此不确定性更小。

录取规则至少存在“顺序志愿”和“平行志愿”两种类型。在“顺序志愿”的规则下,提档顺序是“志愿优先,按分排序”;而“平行志愿”的提档顺序是“分数优先,遵循志愿”。“顺序志愿”的机制与美国“波士顿机制”(Ergin & Sonmez, 2006)的本质相同,可以参考相关研究。本文的案例采取的是“平行志愿”规则。在“平行志愿”的机制下,系统按照分数高低依次提取考生进行匹配,也就是说在处理完考生x的录取之前不会处理分数更低的考生。考生x如果被一志愿退档,会立即投档给二志愿,直到得到录取或该批次的志愿穷尽。这样,高分考生第一批次没能成功提档却被第二批次院校录取的可能性会小很多(何颖,2008)。聂海峰(2007)指出,在完全信息的条件下,“平行志愿”可以满足GaleShapley机制的条件,具有帕累托最优的效率。陈和科斯滕(Chen & Kesten, 2017)认为平行志愿的机制结果更稳定。

总之,中国高考录取从“考前填报”到“估分填报”再到“知分填报”,从“顺序志愿”到“平行志愿”,录取过程中的不确定性在降低。数据表明,各个院校的录取分数范围显著变“窄”,说明录取分数范围收敛,高考录取的匹配质量得到提高(康乐、哈巍,2016)。但是经验研究显示,理论研究的“完全信息”假设在现实中不能满足,考生和家长也并非都按照博弈论推演的最优策略来行动(Abdulkadiroglu et al., 2005),因此录取中的不确定性仍然存在。

(三)高考录取中的不确定性

本文研究的省份采取的是“知分填报”与“平行志愿”的分科、分批、统一招生方案,本文下面的讨论在这一条件下展开。这一机制中的不确定性已经相对较低,但仍然存在。考生面对的不确定性未被直接观察到,可以通过一个比喻性的描述来理解:“不确定性-应对不确定性的行为=不确定性的结果”。也就是说,不确定性可以被考生的行为抵消,而抵消不掉的部分就成为不确定性的结果。三个变量中,不确定性观察不到,但应对不确定性的行为、不确定性的结果可以利用数据构建指标,从而间接显示不确定性的大小。

考生可以采取“多报志愿”或“低报志愿”的策略来提高自己被录取的可能性。例如,考生在每一批次都多填高校,这样匹配次数更多;考生多报批次,以期被其中一个批次录取;考生选择较为冷门的高校报名“兜底”。这些填报志愿的行为可以在数据中观察到。

需要指出的是,在“平行志愿”的机制下,有时“多报志愿”是没有机会成本的。只要考生是按偏好顺序填报的志愿,能被高顺位高校录取就不会被低顺位高校录取。即便被低顺位高校录取,而他不满意这一结果,只要不去报到就不影响复读,对复读行为的惩罚几乎可以忽略。由此看来,完全理性考生没有理由不把一个批次的志愿填满。假如考生对一本志愿的偏好严格大于对二本志愿的偏好,那么也没有理由不同时填报一本、二本志愿。但事实上,不少极高分段考生的一本志愿没有填满;不少一本考生将一本志愿填满了,但没有填报其他批次。这些现象说明他们认为自己的填报策略已经足够抗衡不确定性,没必要把志愿填满。

考生能采取的填报行为是有上限的。在本文研究的省份,考生同一批次最多只能填报4所平行志愿高校。从批次来看,本科招生也只有提前批、一本、二本、三本等有限的批次。因此,考生的行为不一定能完全抵消不确定性的作用,这时发生的结果就是“落榜”。

本文所说的“落榜”,指的是考生的分数达到了某层次高校的录取分数线,但没有被该层次高校录取。“录取分数线”是什么意思?在录取中,并不是全部考生都有资格参与某一批次的投档。有关部门会根据该批次招生计划的总人数适当放宽范围划线,只有该分数线以上的考生才有资格参与该批次的投档。例如,自2014年起至2018年,宁夏根据一本招生计划的110%、二本招生计划的100%划线,提档分超过这一分数线的考生才能参加该批次的录取,在此范围内提档分最低考生的提档分就成为该批次的“最低录取控制分数线”。三本与高职、专科的划线标准则没有说明,很可能是根据经验给出的。

另外一种分数线是高校最终按计划完成招生产生的“录取分数线”。某高校常规录取的考生中提档分最低者的提档分就是该高校的“录取分数线”,某批次全部高校“录取分数线”中最低的则成为该批次的“录取分数线”。“最低录取控制分数线”和“录取分数线”的名称相似,实践中都可能被叫作分数线。后文所说的“分数线”,指的都是实际完成招生计划后形成的“录取分数线”。

在考生填报志愿时,知道该省公布的“控制分数线”,但不知道“录取分数线”。“控制分数线”给出了录取的下限,如果录取中没有不确定性,排名在招生计划人数范围内的考生全部得到录取,而“控制分数线”放宽了范围,那么“控制分数线”就应该低于“录取分数线”。本文案例中两条分数线相等,说明存在不确定性。

不确定性如何起作用,又与哪些变量相关呢?高等教育机会供小于求,因此总有考生不能被其偏好的高校录取。具体是哪些考生落榜,是不确定性的结果。可想而知,考生的分数越高,录取中的优先级就越高,越可能被偏好的高校录取,不确定性也较小。如果每个考生都知道别人的志愿偏好是怎样的,进而找到跟自己的排序对应的高校进行填报,也不易落榜。这说明不确定性的一个来源在于考生的偏好不一致,而且获取完全信息需要付出成本。

要获取跟自己存在竞争关系的同分段考生偏好的信息,其成本与该分段内考生数量有关。人数越多,考生做决策需要获取的信息就越多,获取信息一定的条件下不确定性就越大。当然这一关系不一定是线性的。由此有如下假设。

研究假设I.1:不确定性随着同分段人数的增加而增大。

研究假设I.2:不确定性随着录取优先级的降低而增大。

由此可以推测,处于极高分段的考生面对的不确定性比较小。他们的录取优先级最高,而且分数相近的竞争者人数比较少,竞争者的偏好也容易获取。由于我国高等教育资源比较集中,这些考生的偏好容易推测,高校招生组还可能主动与考生联系,协调其志愿填报,以确保考生的偏好能得到满足。

此外,不同群体应对不确定性的行为还可能会呈现差别。例如,比恩斯等(Byrnes et al., 1999)对150项研究进行元分析后发现,女性更加风险厌恶。梅瑟和莱特豪(Mather & Lighthall, 2012)发现压力增大时男性更倾向于采取冒险的决策,而女性则更倾向于采取风险厌恶的决策。又如,豪斯霍佛和费尔(Haushofer & Fehr, 2014)认为出身贫寒的人更有可能表现出风险厌恶的特征,而基什葛发特和坎贝尔(Kish-Gephart & Campbell, 2014)则发现出身于富裕阶层和低收入阶层的职业经理人比来自中产家庭者更愿意冒险。霍克斯比和艾佛利(Hoxby & Avery, 2013) 发现农村考生容易出现“高分低录”的现象,这可能是由于农村考生更倾向于风险规避(陈思等,2018)。类似的情况也发生在少数族裔身上(Roderick et al., 2008; Smith et al., 2013)。巴斯特多和佛拉斯特(Bastedo & Flaster, 2014)认为这些美国研究可能并没有反映美国大学录取的实际过程。而基本上以分数决定录取的中国高考则在最大程度上规避了潜在的问题,成为研究这一问题的绝好案例。陈思等(2018)发现中国高考中农村考生比城市考生更多“高分低报”,导致“高分低录”,一定程度上验证了农村考生更加风险规避的假设。

根据上述研究的结果,首先作出如下研究假设。

研究假设Ⅱ.1:女生在填报志愿时更加风险厌恶。

研究假设Ⅱ.2:农村考生在填报志愿时更加风险厌恶。

研究假设Ⅱ.3:少数民族考生在填报志愿时更加风险厌恶。

因此,在控制了分数的条件下,可以推测发生的现象是

研究假设Ⅲ.1:控制分数之后,女生落榜的可能性更低。

研究假设Ⅲ.2:控制分数之后,农村考生落榜的可能性更低。

研究假设Ⅲ.3:控制分数之后,少数民族考生落榜的可能性更低。

由此,高考录取中的不确定性便与教育获得差异的研究议题联系起来。以往对于社会分层与流动的研究认为,处于劣势地位的弱势群体面临着更糟糕的教育条件。如果没有数据,研究者容易假设弱势群体在高考中更容易“落榜”。但本文认为,由于弱势群体对“落榜”的承受能力更弱,报考行为可能更加风险厌恶,结果反而更不易“落榜”。本文希望以行为视角给以往的分层研究带来有益的补充。

二、数据与变量

(一)数据

本文采用的数据是X省2014年的完整高考数据。该高考数据包含以下部分:报名库,包含全省考生的基本个人信息;成绩库,包含全省考生的高考成绩、加分情况以及相加所得的提档分数;志愿库,包含全省考生的志愿报名情况,三本、高职(专科)的志愿填报情况不在其中;录取库,包含全省考生的录取高校与院系等信息。

X省采取的是分科、分批、统一录取,录取采用“知分填报”和“平行志愿”的规则。X省招生的科目类别包括:文史、艺术(文)、体育(文)、理工、艺术(理)、体育(理)和单独考试,其中文史和理工类占了大多数。X省招生计划类别包括:非定向、国防生、民族班/预科、国家专项计划、地方专项计划、高水平运动队/艺术特长生/直招士官生。X省招生批次分为:艺术本科、提前录取一本、提前录取二本、专项计划本科、一批本科、二批本科、三批本科、提前录取专科、高职(专科)。

按研究目的需要,本文对研究数据进行了进一步处理。首先,从科目类别上看,由于艺术生、体育生的录取逻辑与常规考生不同,单独考试(主要是部分高职专科招生)与高考独立,这些考生与常规的文科、理科考生之间不存在竞争,因此将其从数据中剔除出去。本文研究对象只是常规的文史类和理工类考生,占全部考生的88.3%。这一步骤去除了艺术本科批次的考生,接下来将剩下的批次进行合并,把提前批一本和专项计划本科并入一本,提前批二本并入二本,提前批专科并入高职(专科)。在这些考生中,被特殊招生计划录取的考生占4.7%。

(二)变量

本文的自变量包括考生性别、民族和城乡户口。社会学研究中常见的父母教育程度、收入、职业等变量在数据中没有。由于该数据是在高考报名、考试、录取中形成的行政数据,这些变量与高考录取并没有直接关系,因此未得到妥善采集也情有可原。未能考察这些变量的效果,是本文的一个局限。

本文的自变量还包括考生报考志愿的行为。根据前文所述,本文从两个方面考察考生填报志愿采取的策略:“多报志愿”和“低报志愿”。

“多报志愿”的策略指的是考生参与批次越多,在每一批次中填报志愿数越多,被录取的可能性越大。考生填报志愿批次的数目,就是其志愿批次数。考生在各个批次中所填报的高校的数量总和,就是其志愿高校数。数据中的志愿库不包含三本、高职(专科)的志愿,因而存在局限。如果考生没有在志愿库中出现,说明他没有填报二本及以上的批次、高校,作为缺失值处理。

“低报志愿”的策略指的是考生报名的高校招生计划在录取中分数线越低,被录取的可能性越大。为避免极端值对录取分数线的干扰,本文用距最低10%处的提档分作为某校分数线。提取了考生志愿中优先级最高和最低的高校及其招生计划后,就知道了考生在填报时最偏好的高校和保底高校分数线。例如,考生x填报了提前一批高校A、一本一志愿高校B以及一本二志愿高校C的民族班计划,那么A的分数线就是该生优先分数线,而C的民族班分数线就是保底分数线。这两条分数线越低,说明考生的填报行为越保守,也就是“低报志愿”。

本文的因变量为不确定性的后果——“落榜”。现实生活中,录取结果不如考生心愿,就可能被看成“落榜”。但在数据中,每个考生的偏好如何不为研究者所知,只能通过他真实填报的志愿来加以推测。另一个难题是甄别考生偏好中的“真偏好”。本文的案例中把批次填满一般没有机会成本,因此考生可能在一本里填报了ABCD四所高校,但实际上只有A和B是真偏好。如果这时考生被C录取,他有两个选择:一是去C报到入学,二是不去报到而选择复读。第一种情况下研究者无法把实际选择与真偏好区分开,因为表现出的行为是一样的;而第二种情况下研究者可以把真偏好识别出来。根据报名库中考生的出生日期、性别、监护人等不应在一年之内发生改变的信息,本文找到了98.0%的2014、2015年都在X省参加高考的考生,也即“次年复读考生”,也就是说,他们2014年“落榜”了。

据此,通过如下两个条件定义“落榜”考生。

条件1:考生的提档分不低于某一批次的分数线。前文已经提到,本文的数据中“控制分数线”与“录取分数线”恰好相等。条件1有两层含义:首先,由于其分数不低于该批次的“控制分数线”,因此该考生有资格参与该批次的录取;其次,由于其分数不低于该批次的“录取分数线”,说明有与该考生分数相等或更低的考生被该批次的高校录取了——易地而处,如果该考生填了那些考生的志愿,本会被该批次录取,此时未被录取是不确定性的结果。

条件2:考生的志愿批次中包含这一批次的志愿。例如,考生提档分数超过一本分数线,但是在填报志愿时没有填报任何一本志愿,这说明他对二本的偏好超过一本,因此不被一本录取不是不确定性的结果,而是他的选择。这种情况非常少见,但也应该排除。

同时满足条件1与条件2的考生是该批次录取中面对不确定性的考生群体,有四种去向:录取不复读、录取复读、未录取不复读、未录取复读。这四种情况中,未录取的两种情况是不确定性的结果,而得到录取的考生如果选择复读,说明被录取的高校不符合其真实偏好,也可以当成“落榜”。由于缺乏考生填报三本和高职(专科)志愿的信息,后文的分析中主要关注提档分大于或等于一本线(“一本区间”)和分数大于或等于二本线但小于一本线(“二本区间”)的情况。

(三)录取结构

图1和图2分别是文科与理科的录取结果。为增强可读性,将各批次合并为一本、二本、三本、高职(专科)四种情况,录取结果用灰阶标出;将复读的考生区分为录取后复读和未录取复读两种情况,不再区分其录取批次。为了提供参照,图1、图2中标注了北京大学、一本、二本和三本的录取分数线以及学生提档分的概率密度分布。

录取结果显示,文科跟理科的录取结构相似,而不同批次之间有本质差异。李代(2017)假设考生具有相似的偏好结构:当院校对考生按照从高分到低分的顺序进行遴选时,考生也同样对院校按照一本好于二本、二本好于三本、被录取好于未录取的偏好进行选择。这时,“分数超过一本线”近似于“被一本大学录取”。数据表明,这一假设对二本线以上的考生大体成立,但是对二本线以下的考生却不完全成立。以理科为例,三本录取线在320分附近,有很多学生尽管达到了录取线,但选择了高职(专科)或者复读,有一部分复读的考生还是已经得到录取的。从偏好上来看,分数越高的考生越偏好三本或复读,分数越低越偏好高职(专科),但是偏好的强度远远不如一本和二本。在三本线以下,有部分考生尽管达到了高职(专科)的录取标准,但是放弃了求学,也没有复读。总之,李代(2017)完全依据提档分成绩来推测当年考生的录取情况,对于二本线以上的考生大体是成立的,而二本线以下则不然。录取结构的差异表明,不同层次的教育无论是质量还是在就业市场上释放的信号都大为不同,因此考生对各层次教育的偏好程度有较大差异。例如,有一定比例的考生认为专科教育的投入产出比好于三本。高职、专科院校毕业生掌握一技之长,对口一些特定的就业机会,在就业市场有一席之地。由于此前大多数调查研究并不区分本科教育的不同层次,因此难以找到直接比较职业教育和三本教育回报的经验研究。陈伟、乌尼日其其格(2016)研究了职业教育与普通高中教育收入回报的差异,发现改革开放早期职业教育的收入回报曾经超过高中。这表明前面的推测有现实依据。此外,三本大学以民办居多,而杨钋、刘云波(2016)发现,民办院校的学费显著高于公办院校,高昂的成本可能也是考生宁肯复读的原因。目前社会调查中测量教育程度时往往假设大学本科好于大学专科,但是从录取结构来看,应该进一步区分大学本科中的不同层次。从国家政策导向上看,其最终目标可能是不分批次——已经有部分省份合并了二本和三本,因此以批次作为高校质量的指标或许将逐渐成为历史,但这不意味着此处揭示的问题消失了——考生和用人单位总能找到其他指标来衡量学历的层次。

(四)应对不确定性的行为与结果

根据图1和图2,本文分析了落榜的结果与学生所报志愿高校总数和批次数之间的关系。限于篇幅,这里仅对结果加以简单说明。研究发现,志愿高校数和志愿批次数的变化趋势比较相近,在一本线以上随着分数降低而增加,在一本线以下随着分数降低而减少。一本线以下的大多数考生没有资格提档,只能通过特殊计划被一本录取,因此有效的志愿批次和院校数量也受到了限制,所以一本线以下填报一本志愿的学生减少了。

“落榜”比例的分布符合研究假设I.1和I.2的预期:同分段的考生数量越多,不确定性也越大;优先级越高,不确定性越小。在北大线以上,由于人数少,优先级高,不确定性很小,因此填报志愿的数量很低,“落榜”的比例也极低。随后随着人数增加,优先级降低,不确定性增大,而“落榜”的比例也随之上升。到了二本区间的最高分段,尽管同分段人数较高,但是由于优先级较高,不确定性较低,而且考生行为也更风险厌恶,所以“落榜”比例也较低。随着二本区间内优先级的下降,“落榜”比例又逐渐增加了。

三、社会经济变量与不确定性的关系

(一)自变量与应对不确定性的行为

应对不确定性的行为在不同的社会群体中是否存在差异呢?研究假设Ⅱ假定女生、农村考生和少数民族考生在报志愿时更加风险厌恶。为了检验“多报志愿”策略是否符合研究假设,首先以志愿高校数和志愿批次数为因变量,以性别、民族、城乡为自变量,控制提档分及其二次项,分别对填报了二本及以上志愿的文科和理科的考生进行线性回归分析。

结果显示,女生在文科的志愿高校数和志愿批次数、理科的志愿高校数上显著少于男生,而在理科志愿批次数上显著多于男生。少数民族考生的志愿高校数和志愿批次数都显著多于汉族考生。农村考生在志愿高校数上与城市考生没有显著差别,但是在志愿批次数上显著多于城市考生(见表1)。

其次,用线性回归模型探索不同群体在“低报志愿”策略上是否存在差异。用“优先分数线”和“保底分数线”作为因变量,自变量保持不变,用线性回归模型考察自变量对因变量是否有显著影响。研究结果表明,女生的文科优先和保底分数线、理科优先分数线都显著低于男生,理科保底分数线与男生没有显著差别。少数民族考生在优先分数线上显著高于汉族考生,而在保底分数线上则显著低于汉族考生。农村考生填报志愿时文科优先分数线和理科优先、保底分数线显著低于城市考生,文科保底分数线则没有显著差别。

综合两个策略的情况,可以看到农村考生在多数情况下比城市考生更加保守,他们填报的志愿更多,志愿的分数线更低。少数民族考生跟汉族考生相比也更加保守,但是他们的最优先志愿比汉族考生分数线更高。女生有风险厌恶的一面,更容易采取“低报志愿”的策略来增加录取的优势;但是女生更不容易采取“多报志愿”的策略,说明性别差异可能还需分情况讨论。总之,研究假设II得到部分验证。

(二)自变量与不确定性的结果

至此,本文已经展示出应对不确定性的行为——“多报志愿”和“低报志愿”在不同社会群体中存在差异。由于研究假设Ⅱ不完全成立,研究假设Ⅲ需要修正。以“落榜”为因变量进行分析,应该假设农村考生、少数民族考生“落榜”的可能性更小,而“落榜”的性别差异不一定显著,正负也不确定。下面分别对文、理科的一本区间、二本区间考生用逻辑斯蒂回归进行分析,以检验研究假设。

需要注意的是,分数在一本区间和被一本大学录取是两个截然不同的概念,因此研究的样本量与表1中描述的各层次大学录取人数有所差别。为了让这里的研究结果更清晰,将研究总体进一步限定为非定向考生。这是因为专项计划、民族班等特殊计划明显向某些社会群体倾斜,以便让符合条件的考生在分数未达门槛的情况下也能得到录取。其作用比较清楚,不需纳入模型。因此,这一部分的研究排除了特殊招生计划的影响,将重心放到非定向考生身上。

这里考察两组自变量,分别对文科、理科的一本区间、二本区间考生四个群体进行考察,一共8个模型。第一组模型I中自变量为提档分、性别、城乡、民族,第二组模型Ⅱ增加了志愿高校数和保底分数线分别作为两种策略的指标,以检验应对不确定性的行为是否可以解释群体间“落榜”的差异。为了增强嵌套模型的可比性,模型I和模型Ⅱ的样本保持一致。研究结果见表3。

研究发现,研究假设Ⅲ只是部分得到了验证。从系数取值来看,除了女生在理科一本区间和农村考生在理科二本区间之外,系数正负都符合研究假设的预期,也就是女生、农村考生以及少数民族考生更不易“落榜”。从显著性角度来看,性别差异只在理科二本区间显著,城乡差异只在文科二本区间不显著,民族差异则在文科一本区间不显著。

尽管根据现有理论提出的研究假设能解释大部分科目—分段的情况,仍然有两个科目—分段的情况不符合理论预期。为什么女生在理科一本区间更易落榜(姑且不考虑显著性问题),农村考生在理科二本区间更易落榜呢?这两个社会事实与本文理论假设相反,也难以在现有研究中找到解释。这说明还有其他因素在发挥作用,而这些因素现有研究脉络还没有充分地注意到,值得今后的定性研究进行探索。

尽管多数情况下研究假设得到了验证,但应对不确定性的行为并没有很好地解释不确定性结果的差异。如果本文用来刻画考生应对不确定性行为的两个指标完全抓住了考生应对不确定性的努力,那么应该看到控制考生行为后其他变量的系数变得不显著或者绝对值变小。但实际上,除了理科一本区间的民族差异之外,系数都并未从显著变为不显著,理科一本的城乡差异和文科二本的民族差异系数还变大了,其他显著系数尽管绝对值有所减少,但幅度有限。这说明本文刻画应对不确定性行为的两个指标还有待改进,值得今后的研究继续探讨。

(三)二本线以下考生的选择

至此,本文对在一本线以上的一本区间以及在一本线二本线之间的二本区间考生进行了分析,并对研究假设进行了检验。由于二本线以下考生的行为模式与二本线以上不同,控制了分数之后,其教育获得差异不是不确定性驱动的,而是教育偏好驱动的,因此应该用不同的模型加以分析。如果各群体的差异与二本线以上不同,就有可能抵消或加剧二本线以上考生的差异,从而使得全部考生中的教育获得差异发生变化。为此,还要补充对二本线以下的考生行为的研究。下面研究的考生是全部文科、理科的考生,包括各种特殊计划录取的考生。

由于二本线以下考生的各种选择之间不是严格的序列关系,因此本文以“不继续求学”为参照组,以“本科(不复读)”“高职(专科)(不复读)”“复读”为因变量,采用多分类逻辑斯蒂回归模型来分析二本线以下考生对三种去向的偏好差异。

结果显示,在二本线以下的考生中,女生比男生更倾向于选择高职(专科),更不倾向于选择三本或复读。农村考生比城市考生更倾向于选择高职(专科)或复读,更不倾向于选择三本。少数民族考生比汉族考生更不倾向于选择高职(专科)或复读,而是否就读三本取决于科目,文科更倾向于读本科,而理科则相反。这些差异的原因还需要进一步的研究,而进一步研究的前提是区分不同层次的本科教育。

(四)控制分数后的教育获得差异

回到本文最初提出的问题:如何阐释在控制了高考分数之后各个社会群体之间出现的教育机会差异?需要综合考察三种不同力量的影响:二本线以上的不确定性对群体升学机会的影响,各类特殊计划对少数民族考生、农村地区考生等群体的优惠政策影响,以及二本线以下不同群体考生的偏好差异。至此,本文已经对三种力量或多或少地进行了讨论,可以预测总体中控制了分数之后各个群体之间的差异。

假如研究问题是以“本科”为因变量来考察教育获得差异,控制了高考分数之后,各群体之间的差异会如何呢?从性别来看,二本线以上不确定性的差异不显著,而二本线以下女生更不倾向于读本科,因此有可能总体上呈现出男生占优的情况。在城乡差异方面,二本线以上不确定性对农村考生更有利,各类针对贫困地区的专项计划也对农村考生有利,但是二本线以下的农村考生非常不倾向于读本科,两个力量相互抵消,总体上呈现什么情况不一定。在民族差异方面,二本线以上不确定性对少数民族更有利,加之各类面向少数民族学生的特殊计划,二本线以下少数民族考生对本科的偏好还存在文理科的差别,可以预计在总体上呈现出少数民族占优的局面,而且文科胜于理科。

表5呈现了控制高考成绩之后各群体本科教育机会的差异。性别差异和民族差异一如预期,而城乡差异则显示农村考生的劣势明显,可能说明二本以下的偏好效应远大于另外两种力量。

四、教育扩张与不确定性的关系

改革开放以来,高等教育政策中最大的变革之一就是教育扩张。直观地来看,招生人数越多,录取比例越大,考大学就更容易,不确定性就越小,学生焦虑感也越轻。高考录取中的不确定性是否会随着教育扩张而缓解呢?在本文的经验分析之后,很多人可能会认为对应的政策启示之一就是继续教育扩张。

从个体层次上来看,可能的确如此。从群体层次而言,情况就不一样了。例如,尽管北京大学在北京招生的比例要远远大于安徽,但假如把北京大学的本科全体学生作为研究总体来发放问卷,询问其在高考录取中感受到的不确定性,很可能北京生源的平均不确定性要高于安徽。何以如此?下面用简单的计算模拟来说明这一问题。

根据前文的研究发现,首先提出一些假设来简化问题。假设只有分数线上的考生面临不确定性,高于或低于分数线的都没有不确定性。再假设同一分数的考生越多不确定性越大,而且二者之间呈严格的线性正相关关系。为了作图方便,选择0.3作为线性关系的系数。最后,再控制比较的基数不变。这时,地区之间教育扩张程度的差异可以抽象为同一个分数分布上分数线的左右移动。

令分数等于阈值t的人面对不确定性xt,而凡是分数不等于阈值的人面对不确定性为0。设分数等于阈值t的人数为nt,而xt是一个关于nt的函数,则有xt=f(nt)。由此可得,相对于t,阈值向左移动到t-1处时,不确定性s总的变化为

假如研究的对象是高于或等于阈值那部分人群,在这样的条件下,只需要知道有多少人通过遴选,也就是分数等于或大于阈值的人的总数,再用其作为分母来计算平均的不确定性感受即可。令最高分为max。这样,当阈值从t移动到t-1时,平均不确定性的变化为

不确定性s总的变化和平均变化如何,取决于n的大小和f(nt)的形式。前面假设xt=0.3nt。利用理科生全部高考数据进行模拟,穷举分数线从最高分开始移动,计算得出每一种情况对应的总不确定性和平均不确定性。

由图3可见,在高分段,随着分数线降低,分数线对应的人数增多,也就意味着不确定性影响的人数增加,而且每个人的不确定性也在增强。二者共同作用之下,高分段呈现分数线下降、群体不确定性增强的趋势。而在中低分段,也就是分数线移动过了分数概率密度分布的峰值之后,分数线影响的人数越来越少,每个人的不确定性也越来越低,就会出现群体不确定性降低的趋势。

这一现象背后的道理在其他现象中也能看到,例如“班级规模悖论”发现,当班级差异较大时,学生对平均班级大小的感受要比实际更大,因为有更多的学生在大班级;在节点度数差异较大的社会网络当中,大多数人拥有的朋友比他朋友的要少(Feld & Grofman,1977; Feld,1991)。“班级规模悖论”对社会学研究的启发在哪里呢?当进行大规模调查时,如果问题关心的变量与人数相关,那么对这类变量的阐释就必须加倍小心,以免得出有误导性的结论(Feld & Grofman, 1977)。

同样,在高考录取的思想实验中,如果从群体视角来看教育扩张与不确定性的关系,会发现分数线下降反而可能导致群体不确定性增加。当然,当分数线越过峰值之后情况会发生改变,因此应该具体问题具体分析。总之,思想实验的结论是:分数线越低,考生群体面对的平均不确定性反而会变大,尽管给定排名的考生个体面临的不确定性会变小。因而可能需要在提问题时澄清到底关注的是哪个层次的不确定性。

五、结论与政策建议

在研究教育获得差异时,如果控制了标准化考试分数等学业表现,社会经济变量的含义是什么?在中国主要依据标准化考试分数分配教育机会的制度下,这一问题尤其重要。本文提出,录取中的不确定性、倾向特定群体的招生计划以及考生的不同偏好与行为均可为这一问题提供解释,其中不确定性问题是本文研究的重点。

研究发现,二本线以上和以下考生的行为模式有明显不同,需要分别讨论。在二本线以上,驱动差异的力量是不确定性。总体来看,越接近相应批次的分数线,“落榜”越可能发生;越接近一本分数线,考生的行为也越倾向于风险厌恶。在二本线以上,女生、农村考生和少数民族考生体现出不同程度的风险厌恶倾向,与此前对不确定性的研究一致。不确定性的影响在性别方面差异不大,但是对农村和少数民族考生有利。二本线以下,教育机会分配的筛选性降低,驱动教育获得差异的是不同群体在三本、高职(专科)、复读和辍学等不同去向间的选择,而且其偏好与二本线以上未必一致。

除了学理价值之外,本研究的结论有何政策意义呢?本文以教育扩张政策为例,探讨了教育扩张与不确定性的关系。根据计算模拟的结果,本文提出教育扩张能降低给定个体的不确定性,但不一定能降低群体的不确定性。本文开篇提到,不确定性带来学习压力与焦虑,因此对于以扩大招生来降低学生群体学习压力与焦虑的观点,本文持保留意见。当然,压力与焦虑不一定不好,减轻压力与焦虑也不是教育政策的唯一目标,但在进行政策评估时,不能忽视这一客观影响。

此外,本文展现了控制学业表现之后不同群体考生的偏好与行为方面呈现的结构差异。这也提醒决策者在制定公共政策时需明确政策目标与目标群体,从而提升政策的效果。例如,在二本线以下的农村考生对三本兴趣不大,这很可能是因为三本大学以民办为主,学费过于昂贵,而回报不甚理想。因此,如果政策目标是要提高农村考生在三本的就学比例,那么加分投档、降分录取等政策就意义不大,应把更多资源投向学生的奖助学金或贷款。与此相关的另一个问题是,三本的教育回报是否确实比高职(专科)更高?今后的社会调查在测量教育程度时有必要区分不同层次、类别的本科,才有条件回答这一问题。如果三本的教育回报不如高职(专科),那么就得重新评估鼓励农村考生就读三本的政策了。

为了检验分析的结果是否稳健,本文进行了一系列稳健性测试,包括用志愿数的中位数替代平均数,在模型中把报考批次组合作为定类变量放入模型,把每一个少数民族都放入模型,等等。上述检验对前文结论的改变不大。

因为“落榜”的发生次数较少,本文还采取了罕见事件逻辑斯蒂回归(logistic regression in rare events data)(King & Zeng, 2001)重复了表3的分析。为了测试以一本录取分数线、二本录取分数线作为定义“落榜”的标准是否稳健,还将定义标准上调了5分并重复了表3的分析。综合来看,这两个分析的结果虽有变化,但对原来的结论改变不大。

此外,限于篇幅和能力,本文在有些问题的分析上存在不足。用志愿高校数、志愿批次数以及志愿分数线来对不确定性的应对行为进行操作化,将其加入模型后并未使群体差异消失,说明这一操作化方案有待改进。此外,从数据中直接剔除被特殊计划录取的考生,手法也过于简单,应该还有更加科学的做法。

其次,本文数据中不包含考生父母的教育、收入、职业与行业等阶层方面的变量,因此无法与此前的研究结果进行直接对话。尽管存在这一局限,但本文的数据又有一些独特的优势。除了样本量较大、学业表现的测量比较准确之外,它在一省之内分文科、理科进行分析,相当于控制了地域和文理分科这些对教育机会分配有重要影响的变量,因此研究结果又比没有控制这些重要变量的研究更加可靠。

最后,本文使用的是一省一年的截面数据,其具体结果不能一般化到任何省份、任何年份,录取机制不同的省份情况也可能会有所不同。今后如有条件,也可以运用其他省份、年份的数据重复本文的研究,观察本文的研究结果是否仍然成立。

责任编辑:杨可

图片来自网络:ifeng.com

此文经本微信公众号工作人员重新排版。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一觉醒来,竟要和五位樱花妹同居?日本电视台亲自下场就做了这?

一觉醒来,竟要和五位樱花妹同居?日本电视台亲自下场就做了这?

17173游戏网
2026-03-09 14:07:37
TVB前“咪神”大婚惊艳四座,这胸围是真实存在的吗?

TVB前“咪神”大婚惊艳四座,这胸围是真实存在的吗?

娱乐领航家
2026-03-09 21:30:03
江苏女子养大型犬,70岁父亲被咬住院,给狗做了安乐,被网友骂惨

江苏女子养大型犬,70岁父亲被咬住院,给狗做了安乐,被网友骂惨

离离言几许
2026-03-09 20:42:28
35+9+15+绝杀!最后1分钟9分,约基奇不想杀人,只想亖!

35+9+15+绝杀!最后1分钟9分,约基奇不想杀人,只想亖!

贵圈真乱
2026-03-10 12:45:09
48岁中科院美女博导在中东突然去世:死因披露,给儿子留言曝光

48岁中科院美女博导在中东突然去世:死因披露,给儿子留言曝光

博士观察
2026-03-09 16:22:08
300936,直线20%涨停!利好来袭,芯片概念全线爆发!

300936,直线20%涨停!利好来袭,芯片概念全线爆发!

证券时报e公司
2026-03-10 12:02:39
上海人最近太爽了吧!出门偶遇明星像开盲盒!周冠宇回家,胡彦斌野餐...这也太顶了!

上海人最近太爽了吧!出门偶遇明星像开盲盒!周冠宇回家,胡彦斌野餐...这也太顶了!

新民晚报
2026-03-10 14:05:11
2换2!通知联盟各队!交易正式达成

2换2!通知联盟各队!交易正式达成

篮球教学论坛
2026-03-10 14:29:55
多尔特向约基奇正式道歉:我不是故意打他脸 不觉得这是一级恶犯

多尔特向约基奇正式道歉:我不是故意打他脸 不觉得这是一级恶犯

罗说NBA
2026-03-10 14:21:50
笑死!果然中国人最会的就是取外号,网友:一开口老师就怒了

笑死!果然中国人最会的就是取外号,网友:一开口老师就怒了

夜深爱杂谈
2026-02-15 21:00:32
伊朗外长说新任最高领袖不会与美谈判

伊朗外长说新任最高领袖不会与美谈判

界面新闻
2026-03-10 12:50:37
网传张娜拉去世,经纪公司否认:逝者去世与公司无关

网传张娜拉去世,经纪公司否认:逝者去世与公司无关

韩小娱
2026-03-10 11:20:17
全国人大代表汪道文为年轻人保养支招:保暖很重要,尤其是脖子,特别强调戴围脖

全国人大代表汪道文为年轻人保养支招:保暖很重要,尤其是脖子,特别强调戴围脖

极目新闻
2026-03-09 08:19:52
给厅长开车6年我从不提私事,父亲货车被扣,厅长递来一个眼神

给厅长开车6年我从不提私事,父亲货车被扣,厅长递来一个眼神

小月故事
2026-03-06 14:48:51
2014年,胎儿被车撞出母体,家属放下仇恨,与肇事家庭因祸结缘

2014年,胎儿被车撞出母体,家属放下仇恨,与肇事家庭因祸结缘

没有偏旁的常庆
2026-03-10 06:50:03
江西中年男砸家后续:“底裤”被扒光,女儿曝更多内幕,全怪母亲

江西中年男砸家后续:“底裤”被扒光,女儿曝更多内幕,全怪母亲

天天热点见闻
2026-03-10 03:06:21
近期,一名中国男子去泰国玩,花6000泰铢找21岁女孩,悲剧发生了

近期,一名中国男子去泰国玩,花6000泰铢找21岁女孩,悲剧发生了

鲸探所长
2026-03-01 14:38:25
国际油价突破110美元,对中国经济冲击有多大?

国际油价突破110美元,对中国经济冲击有多大?

牲产队
2026-03-09 20:01:31
老小区通通装电梯?国家发改委最新发声,释放两大明确信号

老小区通通装电梯?国家发改委最新发声,释放两大明确信号

专业聊房君
2026-03-07 17:10:45
给屁眼做美白,已经成为欧美上流社会的肛需

给屁眼做美白,已经成为欧美上流社会的肛需

beebee
2026-03-10 11:09:50
2026-03-10 15:32:49
社会学研究杂志 incentive-icons
社会学研究杂志
《社会学研究》官方帐号
1074文章数 950关注度
往期回顾 全部

教育要闻

学校中层如何修炼“双重领导力”?

头条要闻

牛弹琴:特朗普放风要停战 伊朗称正为美国准备"惊喜"

头条要闻

牛弹琴:特朗普放风要停战 伊朗称正为美国准备"惊喜"

体育要闻

韩国女足羡慕的奢侈品,为何选择中国女足

娱乐要闻

肖战首夺SMG视帝,孙俪四封视后创历史

财经要闻

全民"养龙虾"背后 第一批受害者浮现

科技要闻

“龙虾”狂欢 卖“饲料”先挣钱了?

汽车要闻

蔚来换电和理想5C,谁能硬刚,比亚迪兆瓦闪充?

态度原创

艺术
家居
手机
数码
军事航空

艺术要闻

30000亩杏花开了,新疆的春天这么美!

家居要闻

自然肌理 温度质感婚房

手机要闻

iPhone 17等用户反馈苹果iOS 26.3.1更新BUG:断网、变慢等

数码要闻

外媒探秘苹果M5 Max/Pro芯片:新“性能核”非旧版能效核换皮

军事要闻

刚说完战争很快结束 特朗普改口

无障碍浏览 进入关怀版