和平区把教育发展的理念融入教育信息化产品中,基于大数据战略,以“互联互通、信息共享、业务协同”为目标,确定了区域整体推进基于教育大数据的“数字校园”建设整体方案。
和平区把教育发展的理念融入教育信息化产品中,基于大数据战略,以“互联互通、信息共享、业务协同”为目标,确定了区域整体推进基于教育大数据的“数字校园”建设整体方案。区域整体推进基于教育大数据的“数字校园”建设模式体现为以下三层:
1 、数据采集层(应用层): 该层为“数据源层”,主要完成基础教育内部以业务数据为主的结构化数据,以文本、音视频、机器数据(日志数据)为主的半结构化数据与非结构化数据以及外部互联网数据的采集工作,依靠专业软件进行数据预处理,实现对各类数据有序且规范化地梳理、采集、清洗、标准化规范存储和应用,为数据分析层所需的多维度的数据交换、计算与挖掘服务提供干净且可靠的数据源。在应用层,和平区教育局通过建设“应用生态圈”来实现基础教育各类业务流程优化和高效便捷的数据采集。
和平区教育信息化“应用生态圈”是由和平区教育行政部门主导建设的多个企业、不同产品的聚合空间和管理机制的总称,主要负责制定应用接入标准和应用授权机制、应用授权接入等,应用生态圈内的各种应用通过底层数据平台实现统一身份认证和数据交换,为业务部门提供使用便捷、类型多样的软件产品。“应用生态圈”的应用接入标准,包括要基于数据平台的统一数据规范、通过数据平台接口进行数据交换、符合应用平台的数据安全、运行维护的基本要求等。确认应用符合接入标准,并经过数据平台授权认证,可以将其纳入和平区教育“应用生态圈”范围,供学校和师生选用。“应用生态圈”中的所有应用(图1)在电脑端均通过“和平教育信息化应用平台”(app.hpjy.gov.cn)并以微信扫码的方式登录,移动端(图2)均通过教育局和学校的微信企业号“**学校 ”进行访问。
图 1 和平教育“应用生态圈”现有应用(部分)
图 2 和平教育“应用生态圈”移动端
2 、数据分析层: 数据分析层是教育大数据生态体系的核心层,该层基于目标应用开展对多源数据的样本分析、建模、多维度数据抽取及规则库的定义和递归优化,依托Hadoop数据仓库集群工具(Hive/Pig集群)、分布式应用程序协调服务工具(ZooKeeper集群)、大规模数据计算处理工具(Spark计算集群)、分布式存储工具(Hadoop集群)等完成对实时及离线结构化、非结构化数据集全面的存储、交换、计算、分析、挖掘,实现异构数据的归一化处理,为上层“用户端”的数据应用报表呈现、个性化的需求服务推送、智能化的分析评估、科学化的决策定位提供坚实的依据。
和平教育按照“一个平台、一套数据、一套标准”的建设模式构建了开放、融合、服务为主要特征,形成了标准统一、类型丰富、结构优化、资源共享的“和平区教育云数据中心(图3)”。“和平区教育云数据中心(图4)”是和平区教育信息化的基础平台,通过开放具备良好兼容性的接口,可与第三方应用进行灵活对接,实现一数一源和数据的灵活交换,以营造良好的信息化生态。和平区通过建设“和平区教育云数据中心”,实现了基础教育各类业务流程优化和高效便捷的数据采集。
图 3 和平区教育云数据中心入口
图 4 和平区教育云数据中心架构图
3 、数据可视化层: 数据可视化层主要实现数据的可视化输出,基于数据操作、数据共享与数据服务的统筹化治理,通过构建多维度元数据模型实现对数据共享关系的管理,实现对权威数据源的核查,对数据交换与共享过程中的脏数据、冗余数据进行清洗,根据用户的属性特点和个性化需求,为用户提供数据分析服务。
和平区教育局在数据可视化层重点做了学校应用使用情况分析、学生活动数据分析、学生学业水平分析和学生行为分析四个项目。学校应用使用情况分析重点关注全系统各校用户情况,用户使用“应用生态圈”中的各项应用的实时数据展示,重点应用的数据分析等。学生活动数据分析重点关注学生在校内外参与的各种社会交往和实践活动情况,用以观察学生兴趣和能力趋势,辅助完成生涯规划。学生学业水平分析重点关注学生通过完成作业、阶段性测试等累积的各种过程化数据,监测学业绩效情况,并实现个性化资料推送。学生行为分析项目以个性心理学和学习分析理论等为基础,构建学生行为分析模型,从而实现更加个性化、科学化的管理和服务。学生行为数据维度多,类型较为复杂,目前我们主要基于学生携带校园卡所产生的数据分析学生校内行为。
区域整体推进基于教育大数据的“数字校园”建设可以被理解为是一个全生命周期的“数据闭环”,如图5所示。