作为一项涉及面广、复杂度高、综合性强的系统工程,我们要不断创新思维方式,积极利用信息技术破解教育评价的“痛点”,扭转不科学的教育评价导向,推动评价理念、评价方式和评价内容的“升级换代”,为教育高质量发展保驾护航。

  破“五唯”是一场事关教育事业长远发展的硬仗。作为一项涉及面广、复杂度高、综合性强的系统工程,我们要不断创新思维方式,积极利用信息技术破解教育评价的“痛点”,扭转不科学的教育评价导向,推动评价理念、评价方式和评价内容的“升级换代”,为教育高质量发展保驾护航。

  新技术正在成为教育评价改革的内在变量

  教育评价经历了漫长的历史发展过程。早在西周时期,我国就已经形成了较为完整的考试制度。《学记》中记载的“比年入学,中年考校”,就是每隔一年要对学生的学业和品行进行考查,并制定相应的考查标准。之后,隋朝创立了“开科举士”的科举制度,通过地方预选、全国统考和举荐相结合的方式遴选人才,极大地畅通了社会阶层的流动渠道,使贫寒子弟“朝为田舍郎,暮登天子堂”成为可能,对我国封建社会发展产生了深远影响。在西方,古希腊哲学家采用辩论、谈话、实际操作等方式对学生进行考核。在这个阶段,教育评价主要以质性评价活动为主,依靠教师经验或主观判断来评定学生的综合发展水平。

  随着现代教育制度的建立,美国教育家泰勒提出了以目标为导向的教育评价原理,根据教育目标编制试题,对学生进行统一测试,按照一定的标准对学生的学习结果进行评分。这种标准化考试侧重评价学生的知识掌握程度和认知发展水平,有效克服了测试者的主观偏差,提高了考试的效度。在实践发展中,教育评价还引入心理测量技术,用数学统计方法对学习结果进行精确描述,常见的测验类型有常模参照测验和标准参照测验。在这个阶段,教育评价主要以纸笔测试为主,通过标准化考试来衡量学生对知识的掌握程度。

  近年来,大规模教育评价技术日趋成熟。以经合组织的国际学生评估项目PISA为代表,它结合了学科测验和学生背景信息(家庭社会经济背景、学习动机与策略、学习时间投入、学校教育资源、学校和班级氛围等),采用矩阵抽样、多层线性模型、规则空间模型等测量方法,从多个角度分析学业成就差异的原因。2015年,PISA全面采用计算机测试方法,并构建了大规模的教育评价数据库,在数据挖掘技术的支持下及时发现问题,为各国教育决策提供参考。从这个阶段,教育评价开始引入计算机测试,弥补了纸笔测试难以对学生行为表现(如言语表达能力、动手操作能力、问题解决能力等)进行测量的不足,重点关注学生的能力表现以及学习结果背后的原因分析。

  目前,教育评价越来越重视信息技术的重要作用,在实践探索中形成了计算机自适应测验、电子档案袋、学习分析技术、数字画像、基于大数据的课堂观察、区域教育质量监测数据平台等多种评价方式。新技术正在成为教育评价改革的内在变量和活性因子,为破“五唯”带来了新的可能。

  新技术推动教育评价理念与方式的深刻变革

  随着 领域的深度学习算法提供了新思路。美国斯坦福大学科辛斯基教授设计了一种算法,只需要用户在Facebook(脸书)上的227个点赞行为,就能大致判断出用户的性格特征。这表明,通过网络痕迹可以对学生的人格、兴趣、心理健康等进行预估,为全方位地评价学生提供参考。我们要善于利用信息技术的优势,建立科学的教育质量评价体系,不再用同一把尺子衡量所有学生,把品德、身心发展水平、兴趣特长养成等作为教育评价的主要内容,对不同学生实行差别化评价,鼓励学生发展特长。

  教育评价从散点式的成绩记录转向全景式的数据采集

  过去,教育评价依赖于学生的考试分数或抽样的截面数据,更多是反映静态事实和集体的平均水平。未来,在新技术的支持下,教育评价将从散点式的成绩记录转向全景式的数据采集,通过学生学习、教师教学、学校发展的大数据,描述学生成长和教育发展的动态过程,发现共性背后的个性特征以及各要素的内在关联,促进学生发展和教育改进。

  一是利用学习分析技术建立学习模型,收集学生学习的过程性数据,提供可视化的“学习体检表”,全面展现学生的知识结构、能力表现、内在潜能等方面的数据,并对可能出现的学习困难进行预警和诊断,帮助老师准确把握学生的学习进展和认知特征,为学生提供最优化学习方案。

  二是利用区块链技术开展分布式学习记录,建立学生的个人学习成长档案,认证学生的多样化学习成就,重点考察学生的非认知能力发展,有效防止数据丢失或被恶意篡改,助力解决学生综合素质评价中存在的信任问题。

  三是利用跨媒体智能技术,探索开展模拟仿真、教育游戏、虚拟任务场景、协作学习环境等新型评价方式,突破传统评价对分数的绝对关注,重点考察学生解决实际问题的能力。引导行业企业、专业机构、社会组织等利益相关方共同参与教育评价,推动考试内容与评价方式的整体转型,使人才培养更加贴合社会需求,提高人才培养的社会契合度。

  四是利用大规模的课堂观察技术,对非结构化的课堂行为数据进行分析,包括教师提问类型、学生回答方式、师生对话深度等,全方位透视学校的课堂实施水平,提炼优秀教师的实践性经验,促进教师隐形知识共享,实现信息技术支持下的教师角色转型和教学能力提升。

  五是利用可穿戴运动设备,包括智能手环、智能手表、智能运动装备等,采集个人运动及身体健康数据,及时发现学生在体质健康、运动技能等方面存在的问题,提供个性化的改进方案,从而实现伴随成长全过程的形成性评价。

  六是利用大数据技术提高教育治理现代化水平,通过全样本、全过程、多模态的数据采集,汇聚形成区域教育大数据,包括学生成长数据、学校运行数据、教育资源配置情况、普职学校规模结构等,帮助管理者获得超越个体或局部的洞察力,提高教育决策的针对性、灵敏性和科学性,努力满足人民群众对多样化高质量教育的需求。

  (作者:曹培杰,系中国教育科学研究院副研究员)

  本文系中国教育科学研究院2019年基本科研业务费专项资金委托项目“‘破五唯’教育评价改革研究”(GYG12019001)成果

中国教育信息订阅号二维码
中国教育信息微信服务号