独立的“第三方评估”逐渐成为各个领域进行评估监测的“利器”,教育领域也不例外。一段时间以来,我国第三方教育评估机构不断引入国外前沿的评估理念,有了先进科学的评估技术、足够专业的研究支撑,取得了良好效果。但也存在着一些问题。本期,我们以美国教

  美国第三方教育评估机构兴起较早且已形成相对成熟的体系, 其提供的评价内容非常丰富,包括对学校效能的评价、对区域教育质量的评价、对学生发展的测评、对学习者的认知诊断、针对各学科和各项能力的考试、学习工具开发等,且根据国家课程改革的方向,不断开发新的评价产品实现教育增值。美国实施教育评估的主体除了少数政府设立的专门机构外,大部分是社会第三方专业机构,包括非营利组织(如EST、ACT等)、商业公司(如培生集团美国分部、CTB)、高校和研究机构(如伯克利测评中心、美国研究院)以及行业协会(麻省教师协会)等。本文选取在美国较具代表性的一家非营利组织和一家商业公司进行介绍与分析。

  非营利组织——美国教育考试服务中心:提供公正有效的评估服务,促进教育公平

  美国教育考试服务中心(ETS)是世界上最大的非营利教育测试和评估组织,成立于1947年,由美国教育委员会、卡内基教学促进基金会和大学入学考试局共同注册。ETS的最初目标是为上述三个机构组织举办国家教师考试、GRE、SAT,并进行提升教育测评水平的相关研究。目前,该组织在除美国以外的8个国家和地区建立了分部。其使命和目标是通过提供公正有效的评估、研究和相关服务,促进教育质量的提高和教育公平。

  发展到今天,ETS作为外包商进行在线测试评分、报告生成与分析等一系列教育评估服务。同时像其他非营利组织一样,ETS也从事一些与教育评估不相关的工作,如就业考试、为微软/IBM/苹果等公司提供考试服务等进行营利。

  目前,美国教育考试服务中心提供45种测试和产品,其服务对象有:K-12教育阶段的学校和学生评估、教育工作者从业许可评估、高等教育机构、英语学习者评估等。其业务类型主要分为两大部分:测试;与联邦、各州政府和行业机构合作进行教育评估项目。

  商业公司——培生集团美国分部:通过学习平台和全球计算机测试系统,提供多样化的学习和考试评估方案

  培生集团美国分部拥有全球领先的数字化学习系统和考试开发、测试及测评系统,其使命是“让生活因学习而丰富”。培生集团在英语教育、中小学教育、专业出版、考试测评、网络教育等众多领域也同样领跑全球。

  2013年,培生集团公开承诺会对学习成效的影响进行持续量化评估并形成报告。培生集团致力于清晰理解如何最大限度发挥和评估其对学习成效的影响,着力构建新的伙伴关系,以满足当前教育的迫切需求。

  同年,培生集团首次发布教育创赢计划,支持教育技术新兴公司,该计划将培生内部的尖端人才与10家新兴公司相匹配,开展为期3个月的试点计划,着力应对来自教育行业的商机和挑战。

  2014年,培生集团启动一项意义重大的新运动——教育普及计划,致力于与同行及社区合作,提高全球教育普及率,使每个人都有机会成功、进步和发展。

  培生集团认为,评估对于教育意义重大,评估有助于解决现实世界的测量挑战,并提供可靠的信息指导教育决策。以Pre-12阶段的教育评估服务为例,培生集团为该阶段提供的评估服务类型如下:自动化语言评估、混合测试、早期教育评估、形成课堂评估、大规模评估、中等教育评估、Pre-16阶段教育与特殊需求评估、干预筛查与监测、教师资格证考试与绩效评估。

  除了多元的教育评估类型,培生集团还采用先进的评估工具MyLab & Matering。作为数字化学习及评估系统,该产品能够对学生的表现给予即时反馈,提供数据驱动指导,帮助学习者更好地吸收课程材料。每个MyLab & Mastering产品具备特定的学科和课程特性,可提升学生的参与度,使教育工作者能够跟踪学生学习进度并根据需要进行及时干预,以帮助个别学生,使每个学生都能取得好的学习效果。同时,REVEL学习平台和Pearson VUE全球计算机测试系统也为学校提供了多样化的学习和考试评估方案。

  对比美国教育考试服务中心和培生集团,看第三方教育评估机构特点

  作为颇具代表性的美国第三方教育评估机构,美国教育考试服中心、培生集团美国分部都已形成了较为成熟的运作模式,拥有自己的教育目标和使命,在发展历程、机构规模、服务对象、业务范围、测评与产品、评估类型以及国际化等方面,都已经发展得较为成熟。

  观察这两个第三方教育评估机构,我们可以看出有以下一些特点:

  标准化测试是第三方教育评估机构的重要业务部分

  教育评估的类型有许多种,可运用的工具也多种多样。不过,目前最为普及和规模最大的评估方式是测试。成千上万的专家和教育工作者经历详细的流程之后,才能创建公正和准确的测试。培生集团美国分部开发的测试流程如下——

  国家标准(每个国家都有相应的教育标准。联邦和州法律要求学生每年都要参加考试,检测他们掌握的学科知识水平。)→创建测试(由包括教师在内的教育专业人士共同努力,拟出成千上万的测试问题,用以衡量学生达到国家标准的程度。)→审查流程(由当地教育工作者审查每个测试问题的准确性、质量、潜在偏差以及标准的一致性。)→确认问题(对每个问题进行测试,以确保其对于各个年级的适切性。)→测试分配(对各种不同类型的问题进行汇总,形成全面的评估,并按照要求决定使用纸笔测试还是数字化测试。)→测试管理(学校根据国家政策管理评估。)→生成报告(家长、教育工作者和行政人员使用测试结果,并生成分析报告。)

  美国很早就拥有良好的教育评估氛围,尤其在标准化考试等测评方面,从1909年起测验研究便进入了兴盛时期,学科测验、诊断测试和练习测验编制等陆续问世,计算机普及之后出现了计算机自适应考试、电子评分系统等诸多新的测验方式,考试技术的发展日新月异。

  考试和评估是密不可分的手足关系,但要认识到本质,消除不正确的考试和评估方式给教育带来的恐惧。正如美国教育考试服务中心在其宣传手册中所陈述的那样——教育评估的真正目的并不在于将人分为不同的等级,而在于帮助人客观了解自己的能力和所处的水平,认识自己擅长和不擅长的事情,帮助人实现更为准确的自我认识,应是一种非常重要的智力服务。

  作为外包商的第三方教育评估机构提供测试、评分和报告分析等一系列服务,旨在为解决教育中的测量问题提供了解学生成就的可靠信息、建立科学的教育问责机制和改进系统并指导教育决策,最终造福学习者和教育工作者。

  利用前沿的技术手段开发评估工具

  美国教育考试服务中心利用基于计算机的评估辅助技术,培生集团开发各种在线学习平台、教学和学习工具和测试系统、利用大数据分析不断推出区域教育质量报告,这些都是互联网、大数据、云计算等技术带给教育评估的便利条件。

  承担政府和行业机构的教育评估项目

  政府委托的教育项目是美国教育考试服务中心的重要业务之一,如推进落实联邦政府和各州政府的教育计划。培生集团美国分部也与各地教育部门合作,承担了不少政府的委托项目。

  不断拓展教育评估的外延和内涵

  这两个机构实施的大规模评估方法多种多样,包括替代评估、学习评估、临床评估、科目内容评估、课程终结性评估、英语学习者评估、总结性评估、基于技术的评估等,在其服务和产品中均有所体现,在不断实践中,拓展了教育评估的外延,并不断丰富其内涵,使教育评估工作越来越专业化。

  注:Pre-12为早期教育到第十二学级,按照美国学制,即截止到中等教育(17岁)结束;Pre-16即为早期教育到第十六学级,按照美国学制,即相当于大学四年制本科教育(21岁)结束。

  (作者王世赟单位系北京师范大学国际与比较教育研究院)

华人教育信息订阅号二维码