摘要

  随着智慧校园建设的逐步深入,各高校先后进入了依靠大数据进行学校治理和辅助决策的信息化阶段。但在运用数据的过程中,我们发现数据质量、数据孤岛等问题制约着应用的发展,成为新的瓶颈问题,因此大家积极创新、探索,开展了一系列数据治理活动,努力提高数据的价值。西北工业大学在多年的探索实践中,总结出了以融合应用牵引数据治理的思路,并取得了较为显著的效果。...

  随着智慧校园建设的逐步深入,各高校先后进入了依靠大数据进行学校治理和辅助决策的信息化阶段。但在运用数据的过程中,我们发现数据质量、数据孤岛等问题制约着应用的发展,成为新的瓶颈问题,因此大家积极创新、探索,开展了一系列数据治理活动,努力提高数据的价值。西北工业大学在多年的探索实践中,总结出了以融合应用牵引数据治理的思路,并取得了较为显著的效果。

 

高校普遍存在的数据问题

  通过与高校之间的互动交流,我们发现各个学校在数据管理模式、数据资源体系建设、技术平台支撑、数据共享、数据开放、数据开发利用,以及数据安全保障等方面普遍存在问题,容易产生数据孤岛,在人员和资产等重要基础数据的统计上常出现不一致的情况,师生存在反复填表的困惑,整体数据质量不高,亟需开展全面的数据治理工作。主要的突出问题有以下几点:一是科学高效的数据管理模式有待建立;二是规范有序的数据资源体系有待进一步建设;三是高效稳定的技术平台还需进一步提升;四是全面的数据共享还没有完成;五是及时有效的数据开放还没有达成;六是基于价值的数据开发利用还没有实现;七是数据安全还得不到高水平的保障;八是数据质量亟需提高。因此,大力开展数据治理迫在眉睫。

数据治理思路及目标

  数据治理是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。数据治理的最终目标是提升数据的价值。

  一般来说,数据治理主要希望实现以下几个目标:一是全面的数据共享,不共享是例外;及时共享、及时更新,不及时是例外;推进高价值的数据应用,量化数据应用效益;二是数据源头统一管理,业务数据统一采集,数据标准统一规范,数据服务统一发布;三是实现校情数据全生命周期管理;四是实现人员和资产等重要基础数据在相同统计口径下的一致性;五是数据治理的成效和口碑逐步形成。

  所以,高校应以实现校情数据全生命周期管理为目标,构建符合学校实际的数据资源目录,厘清数据资产,加速数据确权,推动数据汇集,实现人员和资产等重要基础数据在相同统计口径下的一致性,通过一系列数据应用促进数据治理,让数据治理的成效和口碑成为推动数据治理工作的强大动力。


图 数据治理框架

  在多年的数据治理实践中,我们认为国标《信息技术服务治理第5部分:数据治理规范》(GB/T34960.5-2018)的数据治理框架最符合工作现实,具有较强的指导意义,具体内容包括:

  1.顶层设计包含数据相关的战略规划、组织构建和架构设计,是数据治理实施的基础。数据治理必须有的放矢,需要在一个完整的体系架构中才能开展。对于高校来说,首先要有智慧校园建设的总体规划,明确信息化战略目标、建设任务,统一全校思路;其次要有明确的组织架构,明确建设主体及任务分工,将责任落实到具体部门;第三是做好架构设计,要做到技术可行、可控。

  2.数据治理环境包含内外部环境及促成因素,是数据治理实施的保障。内外环境决定了数据治理是否能够顺利开展。只有内外均有强大动力的情况下,实施数据治理才能阻力最小,最容易达到成效。同时,必须出现具体的促成因素,形成有效的工作抓手,才能逐层深入、具体而有效地推动工作。

  3.数据治理域包含数据管理体系和数据价值体系,是数据治理实施的对象。数据的管理体系决定了具体的数据责任及技术细节,是规范开展数据建设的依据。数据价值体系提出了数据建设的目标,同时这些目标也正是数据治理的重点领域。要开展具体的数据治理,必须先行做好这个环节。

  4.数据治理过程包含统筹和规划、构建和运行、监控和评价及改进和优化,是数据治理实施的方法。PDCA循环为管理学上经典的戴明质量管理循环,适用于数据资产管理和控制的持续性过程管理,提高治理效率。利用这个方法,我们以融合应用为牵引,有计划地分主题、分应用来启动一个领域的数据治理,逐步优化部分数据,使得数据质量逐步完善和提升。就像我们在手机上录入指纹一样,通过若干次的操作,构成一个完整的指纹。

融合应用牵引下的数据治理实践与探索

  要做好数据治理工作,必须具备以上框架的四个要素,才能逐步开展治理工作,并且治理是一个循环上升的过程,也是一个逐步完善的过程。自2016年以来,西北工业大学在上述数据治理框架下开展了大量的实践和探索,积累了丰富的经验,现具体分享如下:

  1.顶层设计规范到位

  西北工业大学在信息化建设中制定了明确的信息化规划、信息化建设实施方案、制度体系、标准规范体系、顶层设计体系,为战略实施奠定了基础。同时,建立了校院两级信息化责任体系,将信息化任务及数据管理责任落实到了具体部门。

  2.内外环境需求迫切

  目前,西北工业大学数据治理的环境因素已经逐渐成熟。在外部因素方面,国家大力推行大数据战略,相应技术飞速发展,大数据应用成果越来越多,带来的效益也更加明显;在内部因素方面,学校领导对数据辅助决策的需求越来越迫切,部门对运行数据的关注越来越急迫,师生对数据统一管理、减少反复填表的要求越来越高。所以,数据治理已经成为学校信息化建设的一项重要任务。

  3.治理体系逐步完善

  西北工业大学在实践中明确思路,必须先行建立起学校的数据价值体系,也就是我们开展数据治理时必须先要明确数据这个整体集合是什么。经过反复思索,学校认为涉及师生管理、学习、生活的已知业务数据就是这个集合,也就是数据的这个“1”。后期随着大数据业务的发展,很多过程数据等内容会逐步扩展这个集合“1”。在此基础上,我们的数据治理工作就变得清晰明了了。

  在数据治理范围确定的前提下,建立数据管理制度成为当务之急。在不断实践的基础上,西北工业大学于2019年正式出台了数据管理制度,明确了数据是学校资产、数据的管理权限、数据的共享程序、数据的标准管理、数据的安全管理等内容,让数据管理责任落实,数据使用有规,并确保数据安全和数据合理使用。

  随后,落实数据主体责任就是必须开展的工作。通过与各部门逐一协商,学校首先明确了单一来源数据的主责单位,而后经过多轮协商确定了多源数据的主责单位,最终在此基础上建成了学校的数据资源目录,使数据治理工作更具操作性。

  最后,为了有效实施管理,学校建设了强大的数据中台、基础数据库、数据仓库,对数据资源进行实时管理,对数据交换共享进行有效支撑。在此基础上,学校还将关键环节可视化,统一集成到“领导驾驶舱”系统,将数据资源状况、数据共享情况实时呈现给领导及用户,有效促进了数据治理工作的开展和数据质量的快速提升。

  4.融合应用牵引治理

  在管理体系建设到位的前提下,我们有计划地分主题、分应用来推动数据治理,每一个应用上线就是启动一个PDCA循环,促进一部分数据质量提升。若干轮应用促进若干轮提升。在这样的应用牵引下数据治理就会逐步推开,数据治理就会越来越好。自2016年以来,西北工业大学已经开展多项应用的PDCA循环。

  一是启动了数据清洗PDCA循环。针对数据库中数据标准化问题、数据缺失问题,策划了专项治理工作。通过技术手段清理显而易见的标准化问题和数据缺失问题,进行有效整改,最终去除基础问题。

  二是启动了“一表通”系统PDCA循环。针对个人数据领域中存在的问题,学校建设并推广了“一表通”系统,将分散在各业务系统中的数据集成整合,向个人用户展示并提供填表服务。通过系统的使用,师生将发现的数据不准问题向数据源提出并整改。对于系统中缺失的数据,师生填报后由数据源单位核查确认后收录进数据库。

  三是启动了“领导驾驶舱”系统PDCA循环。针对学校办公业务数据存在的问题,学校建设了“领导驾驶舱”系统,将决定学校运行方向的关键数据集成展示,在辅助决策中发现数据不准、不一致、数据缺失的问题,并下达整改督办函,促进主责单位尽快整改提升。

  四是启动了“评估”PDCA循环。针对评估工作需要大量数据的需求,将评估所涉及的数据量化分解,变成具体的数据项,并进行数据提取及质量分析,对发现的问题下达整改督办函,促进主责单位尽快整改提升。

  五是启动了“审计”PDCA循环。针对审计工作的需求,将审计模型进行任务分析,对涉及的数据进行量化分解,变成具体的数据项,并对发现的问题下达整改督办函,促进主责单位尽快整改提升。

  后续,学校又在校情系统建设、学生大数据系统建设等环节中按照PDCA循环的模式促进数据治理。也就是不断通过融合应用来牵引数据治理工作,促进数据质量越来越好。

  在此过程中,学校非常重视将过程可视化,让数据的质量状态和治理的过程实时展现在领导和师生面前,从而起到互相监督、互相促进、倒逼整改的作用。

  5.治理成效显著

  在以上数据治理框架下,西北工业大学的数据治理取得了显著进展和成效。依托学校的数据资产平台,建立了数据资源目录,涵盖了16个数据子集、99 个数据类、354 个数据子类、4534 个数据项。开展了数据确权工作,确定2000多个重要数据项的来源单位,为开展数据治理打下基础。根据融合应用的需要,有针对性地对本研教学中教师教学工作量、本研学生在校状态、招生数据,科研项目、科研获奖和专利,科研经费到款情况仪器设备,进行了部门内数据的完整性治理。通过跨部门数据的关联关系治理,促进了科研与财务数据对接,招标采购、国有资产和财务系统的互联互通。在数据治理过程中为10多个部门出具了20份以上数据质量检测报告,数据问题精确定位,极大提升了数据治理的效率。目前,数据中心的数据总量99,857,790条,覆盖学校教学、人事、科研、财务、资产等20多个业务部门的503个业务数据表。

  在学校数据治理的实践中,我们逐步建立了数据管理体系,夯实了数据基础,构建了强大的数据中台,形成了有效的数据治理方法。目前,学校正在深入推动数据治理,并据此开展大数据分析利用,努力为学校的“双一流”建设提供坚强的数据支撑。

  来源:《中国教育网络》杂志(11月刊)
  作者:薛静 张文生 肖琳(西北工业大学信息化建设与管理处)

  投稿、转载或合作,请联系:media@cutech.edu.cn

中国教育信息订阅号二维码
中国教育信息微信服务号