根据数据分析出的监测结果,研制了国家义务教育质量监测报告送达各相关部门并向社会发布,为教育决策调整、教育教学改进提供依据。

  教育在线:这次中央关于教育评价的改革中强调了四点,“改进结果评价,强化过程评价,探索增值评价,健全综合评价。”我印象中您所在的教育部基础教育质量监测中心已经在很多方面先期试点?

  胡平平:是的,上世纪末我国完成了“两基”的目标任务,在解决了孩子们“有学上”之后,我国政府就立即着手采取各种举措推进教育内涵发展,使孩子们能“上好学”。为了摸清教育现状、找到短板、改进提高教育质量,2007年9月12日,中央编办批复教育部,同意成立教育部基础教育质量监测中心。

  教育在线:试点探索十多年来,你们具体做了什么?

  胡平平:自2007年教育部基础教育质量监测中心成立,我们做的事情就是打破以分数和升学率为唯一标准的应试评价体系,用先行先试的实践向人们展示什么是科学的质量观,如何用科学的质量观来评价一个区域的教育质量。

  2015年《国家义务教育质量监测方案》发布,标志着我国国家义务教育质量监测制度正式建立。《方案》对监测的学科、内容、对象、周期等做出了明确规定。

  我们把语文、数学、科学、体育、艺术、德育作为国家义务教育质量监测学科。此外,我们的监测还将调查影响学生学业水平的相关因素,包括所监测学科领域的课程开设、条件保障、教师配备、学科教学以及学校管理等。考虑学生认知和学习能力发展的阶段性特征,监测对象为四年级和八年级学生。根据监测工作的系统性、连续性,每个监测周期为三年,每年监测两个学科领域。考虑到我国义务教育阶段学校和学生量大、面广,监测采取三阶段分层不等概率方式抽取样本。一是抽取县(市、区):根据各县的人均GDP、城市化水平和教育发展状况,在全国31个省(自治区、直辖市,以下简称省)和新疆生产建设兵团每年抽取有一定代表性的县(市、区)约330个;二是抽取学校:根据学校地理位置、学校性质和学校规模,在各样本县抽取学校,全国每年共抽取约6500所小学和初中;三是抽取学生:在每所样本学校的四年级和八年级随机抽取学生,全国每年共抽取约19万名四年级学生和八年级学生。样本能代表全国四年级和八年级学生的情况,也能代表各省的基本情况。一般情况下,每年5月底的一个“周四”,全国统一时间用统一测试工具对样本学生及他们的校长、授课老师进行测试,然后通过保密邮局寄回监测中心,中心组织老师统一批改、统一录入数据平台。

  根据数据分析出的监测结果,研制了国家义务教育质量监测报告送达各相关部门并向社会发布,为教育决策调整、教育教学改进提供依据。报告系统反映了我国学生在德智体美劳等方面的发展状况,在义务教育应当“培养什么人”和“如何培养人”方面发挥了重要的“指挥棒”作用,科学引领了义务教育健康发展。还持续为地方反馈与解读监测结果、开展教育质量监测评价培训。

  教育在线:连续监测下来,你们发现了什么?

  胡平平:我们发现了很多有价值的可供地方乃至全国教育发展借鉴的东西。

  例如,我国中小学生的体育、艺术素养如何?我们监测时,除了用纸笔对学生进行一些问卷填答外,还对学生的实际操作进行一对一的测试。体育需要测身高、视力、握力、肺活量、立定跳远、50米、15米折返跑等;2016年美术绘画测试,给四年级和八年级学生出的题目分别是:以一滴水、两个三角形为基础画一幅图。音乐演唱实操监测是让学生对着计算机唱歌的方式进行。全国5万余人可以同时在线演唱,演唱歌曲分必唱和选唱两种,学生演唱歌曲的数据即时上传给后台,通过 和大数据分析由机器自动给出成绩和评价……这些测试打破了过去以主课考试分数为唯一评价标准的传统,体现并引导了对教育质量的综合评价。2015-2017的监测数据还发现:学生的学业成绩表现良好,80%都达到了合格及以上;但是学生的肥胖、近视、睡眠不足问题非常突出:肥胖率上升,视力重度不良检出率高,睡眠时间少于8小时的比例高,而且这个情况还有继续上升的趋势,必须要引起全社会的高度警觉。

  再例如,2018年北京、上海、浙江、江苏四个省市参加PISA监测,结果显示四省学生学业素养表现排名世界第一,学生爱好阅读兴趣排名第一,而且阅读材料广泛。家长高度重视教育,超过了与四省市家庭经济水平相当甚至更高的国家(地区),但家长的感情支持在参测国家(地区)中处于中等水平。我们的短板在哪儿呢?首先,教育公平需要持续推进,四省市阅读领域学生素养的校间差异比为42%,属教育质量高但校间差异大的区域,其中乡镇学校师资问题成为重要短版;其次,学生学习时间长,学习效率总体不高。四省市学生平均校内课堂学习时间为31.8小时/周,在79个参测国中排第四位。四省市学生的阅读、数学和科学的学习效率(分数/学习时间)在参测国家(地区)中排名靠后,分列第44位、第46位、第54位。最后,学生的幸福感较低,学生学校归属感指数为-0.19,在参测国家当中排51位,生活满意度平均分为6.64分(总分10分),排61位。

  教育在线:你们的这些试点对我国教育更长远的意义是什么?

  胡平平:将有利于突破素质教育困境,引导科学的基础教育质量观。素质教育全面实施多年来,其理念已经深入人心。但在学校和家庭的教育实践中,往往难以深入实施,应试教育倾向难以从根本上扭转,学生全面发展、个性发展得不到真正落实。学生课业负担过重、健康体质状况下滑、社会责任感缺失、创新精神不足、实践动手能力差等问题,已经成为困扰我国基础教育改革发展的“顽症”。针对这些问题,国家已经采取了诸多干预措施,但成效不大,其中一个关键原因是我们只有一个为选拔人才设立的中高考指挥棒。要想真正走出素质教育的“困境”,必须再建立一个学生发展过程性评价的指挥棒,对受教育者的德、智、体、美、劳的发展情况进行“全面体检”,为制定相关政策和实施质量改进提供科学依据,为引导社会科学评价教育质量提供方向、方法和结果。

  同时我们的试点探索也有利于基础教育精细化管理,提升教育科学决策水平。随着各级各类教育普及程度明显提高,我国基础教育改革发展的主要任务已经从“扩大规模”转变为“全面提高质量、促进内涵发展”。“有学上”的问题基本解决,“上好学”的矛盾越来越突出,这对政府教育管理的精细化和决策的科学化提出了新的更高要求。我们需要改变过去粗放的质量管理模式,及时、全面、深入、细致地把握基础教育质量状况,为有关教育管理行为和教育决策提供科学依据,以便更加合理地安排和使用教育经费,更加有针对性地组织实施教育重大工程项目,更加有效地采取质量改进和干预措施,推动教育由“粗放式”向“精细化”转变,推动教育决策由“经验型”向“科学化”转型。同时按照“政府管教育、学校办教育、社会评教育”的原则,国家带头构建基础教育质量监测评价机构,由相对独立的第三方对教育质量做出评价,也是推动管办评分离的必须。

  总之,客观的监测数据是教育评价的基础,我们用数据靠事实支撑的这些成绩和短板冲击了现有的“一好遮百丑”的传统评价。我们的“短板”短在哪里?背后的原因是什么?这些短板是否影响国家对创新人才需求的培养?教育应该怎么改?相信《深化新时代教育评价改革总体方案》的落实,全国各级各类教育的评价改革还要全面深入地铺开,直至影响到每一个区县、学校和学生,影响到全社会。

  教育在线:您认为当前教育评价改革的关键是什么?

  胡平平:当前各类教育质量评价标准正在紧锣密鼓研制中,这项工作得到了社会各界和教育系统广大干部、教师的高度关注,调研中大家一致认为教育评价必须要解决中高考指挥棒在当前教育评价中占据绝对主导地位的问题。一些区域党政负责人缺乏正确的育人观念,过分注重结果,忽视过程,过分关注考试分数和升学率,过分关注重点学校,甚至给学校下达指标,以分数、升学率给予奖惩。对全体学生的全面发展重视不足。因此改革教育评价的关键是端正办学方向、转变教育理念,其中地方党委政府主要负责人又是教育评价改革能否成功的关键。只有地方领导带头转变教育观念,才能调整政策、主导教育部门、引导社会树立科学正确的教育质量观。评价也必须评价地方党委政府。二是由于中国太大,发展很不平衡,因此评价区域、学校、学生必须要看发展、看过程、看增值。评价要有前后对比的增值评价,这才能符合中国实际,才能让所有教育人看到自己努力的成果和希望。新时代,国家对教育的要求一是公平二是质量。因此,评价必须要解决指挥棒和牛鼻子的问题。地方官员要出政绩,评价就是要告诉大家正确的教育政绩观到底是什么。随着各级各类教育评价标准、评价指标的制定和实施,相信新时代的中国教育一定会有更大的发展。

  (胡平平系教育部基础教育质量监测中心副主任,曾任第八、第九、第十届全国人大代表,曾任安徽省教育厅副厅长)

华人教育信息订阅号二维码