在过去的20年中,随着教育政策领域的国际化程度逐渐提高,国际组织对于全球教育政策领域的知识传播、教育质量监测和研究起着越来越重要的作用。

  与贸易、安全与环境政策相比,教育政策的制定好像是世界各国自己的事,关起门就能制定出与本国国情相适应的相关政策。然而,在持续的全球化进程和世界范围的竞争之后,各国教育系统必须应对新兴的全球知识经济带来的新挑战,教育政策也变得越来越国际化。从20世纪90年代初开始,国际交流与合作升温,特别是全球教育政策中的国际组织活动显著增加。一个显著特点是对国家教育系统进行定量评估比较,以及参与这类国际大规模评估的国家数量在不断增加。

  同时,教育政策全球化对国家的影响显而易见:国家政策制定者和其他教育利益相关者都会关注国际层面具有影响力的举措。这些国际层面的驱动力形成了教育问题和优先事项,并挑战了国家层面的政策、政治和传统的教育概念。

  在过去的20年中,随着教育政策领域的国际化程度逐渐提高,国际组织对于全球教育政策领域的知识传播、教育质量监测和研究起着越来越重要的作用。其中,经济合作与发展组织(简称“经合组织”)作为影响教育改革进程的有影响力的推动者,其开展的PISA等定量教育评估已经成为影响世界各国教育系统的大势所趋,并成为比较和评估学生、学校或国家教育系统表现的常用工具。

  PISA如何成为“软治理”工具

  经合组织成立于1961年,是由36个市场经济国家组成的政府间国际经济组织,旨在推动改善世界经济与社会民生的政策。经合组织提供了一个各国政府展开合作、分享经验并寻求共同问题解决方案的平台。其核心工作之一即对各国数据进行分析和比较。

  自20世纪90年代中期以来,经合组织一直强调人力资本的生产,以应对全球化的新兴影响。从人力资本的角度来看,教育是一项投资,国家公共部门应对此负责。这种观点比其他传统观点更关注教育的经济可用性。教育被定义为经济增长的动力,经合组织致力于提高其成员国教育系统的质量、公平、效率和有效性。经合组织对教育成果的理解与所产生知识的效用密切相关,即知识的价值取决于其在其他领域的效用,如应用研究、技术进步等。对产生人力资本的重视成为经合组织教育框架的基石,从而积极推动旨在通过教育增强成员国竞争力的战略和建议。

  经合组织教育活动的主要转折点是从“对教育政策的分散贡献”转变为收集实证性的定量比较数据,从而促使其成为教育政策领域具有话语权的重要参与者:过去,经合组织专注于分别识别各国的差异和特点,现在却果断地将国家与国家之间的标准进行比较。这种直接比较使各国承受着改革其教育制度的更大压力,因为经合组织关于教育表现的统计数据已变得更容易被政治家、媒体和广大公众所理解。

  最重要的是,经合组织通过设计、管理和实施PISA测试,提高了其在教育领域的国际组织的地位。经合组织提供的不只是有关PISA教育信息数据库的证据、分析和建议,而是将PISA作为管理国际教育话语的工具。也就是说,经合组织不仅致力于解决数据收集的方法问题和技术问题,而且促进世界各国作出和改进教育决策。

  目前,PISA的影响力不断扩大,虽然仍有一些国家没有参与,但不参与不等于无关紧要,即便是一些人口规模较小的国家,在改革自身教育体系或设计类似的国家评估机制方面也受到PISA的影响,将PISA作为证明其教育改革合理性和引发教育政策辩论的数据来源,或者利用PISA模型改善有关课程的国家教育系统,教育治理机构及教师资格体系等。因此,PISA的影响力远远超出经合组织成员国,而更进一步影响了新兴经济体和发展中经济体的教育表现,PISA正成为目前国际上广泛适用的教育测评框架。

  经合组织不仅评估自愿参加的成员国,而且通过扩大参与基础逐步扩大影响范围。例如,2015年经合组织启动了“针对中低收入国家发展的PISA计划”。此外,经合组织近年来一直在运行“学校PISA计划”,可以根据数据库中的国家和地区对各个学校进行衡量。有研究者认为,经合组织在教育领域中活动的扩大包括通过衡量更广泛的能力扩大评估范围,通过覆盖更多的国家扩大规模,从而增强对决策者和教育工作者的解释力。

  PISA提供了哪些信息和指标

  PISA是经合组织于1997年开始筹划的一项大型国际性学生能力评估计划,针对15岁学生进行大范围跨国评估,以了解各国推动教育的状况,并反映出该国学生在阅读素养、数学素养与科学素养方面的能力。同时,学生的表现差异、教育资源差异、校际差异、学生的家庭结构、父母的受教育程度和职业以及其他社会文化资产指标等都是重要的研究变量,这些变量之间的相关程度,也是衡量教育公平的重要依据。自2015年起,PISA全面实施电脑化测试,测试题目包括选择题和开放式问题。此外,学生还需要完成涉及社会经济背景、科技产品以及学习经验与职业生涯规划等信息的问卷。

  每轮PISA测试会从数学、科学及阅读三个领域选定一个学科作为主要领域进行深入解读,其他两个学科为辅测领域,比如2006年PISA测试的主要领域为科学,2009年为阅读,2012年为数学,2015年重新回到科学,依此类推。自2000年起,PISA测试每三年进行一次,并于次年发布结果。因此,到目前为止,已经产生了七轮PISA测试结果(2000年、2003年、2006年、2009年、2012年、2015年、2018年),参与国家或地区的数量从2000年的32个逐渐增加,至2018年已有79个国家或地区连续或间断地参与了这项研究。

  每一次公布的PISA测试结果报告,均会为参与国提供以下信息:(1)各国学生教育水平概况;(2)由背景变量进行分析该次调查所得到的学习成绩与人口学、社会经济等教育变量的相关性;(3)趋势相关研究:通过持续的追踪观察、调查的趋势与结果和学生层面、学校层面等背景变量的相关性。PISA的重点目标是提供一个稳定的参考点,以了解教育问题与现状,各学科素养相对的优势与劣势,并提供教育系统改革的方向,为教育改革提供重要的参考指标。

  PISA作为“软治理”的工具,易于获取,对专家和公众都是有用的。专家可以从涵盖的评估数据中提取详细的定量信息,在各项数据之间建立统计相关,并根据PISA数据制定政策建议。同时,公众可以了解国家教育系统的表现,能够根据排行榜进行一般意义上的比较,并通过阅读经合组织提供的相关报告找出为什么有些国家的教育表现比其他国家更好。该过程的总体重点一直放在可比性上,将数据处理为共同的指标进行解释。

  由于PISA测试已定期进行了七个轮次,因此这些排名也会随着时间的推移发生变化,进行比较可以看出一个国家教育系统是否有所改善以及改善的程度。同时,比较性的PISA研究有助于形成“何谓好的教育”的全球概念:国家教育系统根据一组预设定的基准进行评估,该基准涉及哪些因素产生了最佳表现。

  PISA对各国教育产生了哪些影响

  通过使用标准化考试作为衡量教育成果的一种手段,PISA这样大规模的评估可以对国家、地区甚至个别学校的教育系统进行量化和比较。这些比较可用于确定教育系统的优势和劣势,从而促进和塑造教育改革进程。过去十余年,许多国家都有这种趋势,即在PISA等国际评估结果发布之后,教育改革就开始了。

  有些国家在改革教育制度时明确提及了PISA,实际上,所有PISA参与国中约有50%发起了对PISA直接回应的改革。

  以德国为例,有学者评论说,如果没有经合组织的PISA研究,德国的教育体系就不会进行如此之大的改革。尽管人们对PISA或经合组织针对德国教育系统提出的改革措施颇有争议,但PISA是实施本该进行的改革催化剂——这种观点被广泛接受。20世纪90年代中期,人们对德国潜在的教育赤字的认识有所提高,而PISA实际上触发了德国重要的教育改革。尽管该国在2000年的PISA测试中低于平均水平,但通过不断改善,成为2012年PISA测试高于平均水平的国家之一。

  总体而言,PISA的诊断不是一蹴而就的,而是对德国教育体系中所体现的系统性问题的识别,该体系原有的设计旨在优待本已享有优质资源的学生,而忽视了处境不利的学生。这导致大规模的公平问题,自那时起,德国关于教育改革的论述涵盖了对社会经济因素如何决定教育表现的讨论。

  第一次PISA测试结果发布后,德国几乎立即进行了全面的教育改革,以改善教育成果。德国决策者开始超越国界,重点放在其他教育系统表现的背景和值得仿效的方面。重点关注早期教育,以便为学生日后的学术表现创造更好的基础,并在社会经济方面促进处境不利学生(如具有移民背景的学生)的发展。此外,直接仿效PISA的做法,更专注于教育系统的输出,基于实证制定相应的政策,以指导政策决策;并在学校实施比较测试审查教育表现,大力促进比较教育研究。

  像德国一样,丹麦的第一次PISA测试结果也引发了国家重视。在进行深入的国际审查之后,丹麦对增加国家评估程序和处境不利学生的支持作出了实质性改变。而且在PISA测试结果引发广泛的公众辩论之后,丹麦政府和学界进行了许多对PISA测试结果的分析研究,从2003年起就提出相关政策建议。

  尽管瑞士在几轮PISA测试中成绩均处于上游,但约有20%的学生在阅读素养方面表现非常落后。因此,PISA结果使瑞士加强了已有的创新尝试,从而加速教育改革,最终使26个不同的州立学校体系协调统一。瑞士的政策制定者仅在短短几年内就采纳了基于PISA的经合组织关于中学教育的大部分建议,例如社会公平、学校自治和质量保证等。

  关于PISA对日本的影响,日本研究者认为,PISA极大地影响了日本的教育话语和政策改革。在20世纪90年代末期,一些研究显示出日本的教育系统存在巨大缺陷,由此爆发了教育政策危机。在这种背景下,2000年PISA测试的结果被日本政府用作政策和改革的合法性外部来源。

  经合组织发布2000年PISA测试结果之后,以色列教育部利用这一势头成立了一支教育改革特别工作组。研究者认为,在PISA引入以色列教育系统的第一个国际比较排名之前,以色列教育部已经在进行改革。新成立的工作组认为改革必须明确体现PISA建议的“管理主义和全球主义路径”印记,提高以色列国际排名。

  但在美国则出现了截然不同的反应,与其他先进经济体相比,美国在排名中的表现相对落后,却没有引发公众或政治响应。只有2009年PISA测试后,当中国表现出非常好的成绩时,PISA才成为美国教育话语的中心。从本质上讲,这被美国视为新的人造卫星冲击。同样,中国在PISA中的领先地位也被解释为中国在经济产出上超过美国的预兆。

  在其他国家或地区,对PISA的反应因测试周期和专业性而异。例如,英国的教育体系在20世纪80年代已经进行了实质性改革,标准化的考试计划已经司空见惯。英格兰在2000年的第一轮PISA测试中表现不错,但在随后的几轮测试中却有所下降。尽管结果没有显著改善,但对PISA的反应程度为中等水平,英国政府采用“选择取舍”策略来采纳经合组织的建议。

  在芬兰,反应因不同社会地位的群体而异。作为前两次PISA测试中的佼佼者,芬兰政府认为不应该改变学校教育,而认为本国可以作为其他国家的榜样,而芬兰教师作为专业人士,则抱怨国家对教育的微薄投入使得整个教育系统只产生了有限的增值。

  总的来看,经合组织通过PISA测试所产生的实证论据推动了各国的教育改革,其结果和发现被用于引入国家教育评估过程和问责机制,相比之下,除此之外的其他做法则黯然失色。

  经合组织的PISA测试显示了哪些教育政策产生了更好的表现结果,哪些则没有。通过PISA的基准,经合组织向落后国家实施了规范性压力,促使国家决策者通过跨国数据确定值得实施的教育政策。通过生成和解释PISA数据,经合组织还强调适合改善人力资本生产的特定教育系统的特定特征。例如,学校自治与加强问责措施相结合被视为增强中学教育有效性的重要组成部分。

  简而言之,经合组织通过PISA进行广泛的教育数据收集、整理和分析,并进行了公开,作为支持各国教育决策的工具以实现政策导向,这就是经合组织的全球教育“软治理”之道。

  (作者单位系北京师范大学国际与比较教育研究院)

华人教育信息订阅号二维码