高校在日常事务处理中,往往会综合运用到各个系统中的数据,很多关键的信息存在着密切的联系,有互通共享的需要。
摘 要:高校在日常事务处理中,往往会综合运用到各个系统中的数据,很多关键的信息存在着密切的联系,有互通共享的需要。如果能把基础数据信息共享,不仅可以避免数据的重复建设,节约资源,更能解决数据不一致的问题,保障数据的权威性、完整性和准确性。文章以学生信息为例,阐述了各个系统之间的数据联系,提出了建立学生信息共享库,并通过数据交换平台实现信息共享与交换的策略。
关键词:学生信息;共享库;数据交换平台
中图分类号:TP274 文献标志码:A 文章编号:1673-8454(2013)13-0076-03
随着信息化进程的不断推入,信息间流通的需求日趋强烈,信息的使用效率也需要提高。实现信息共享,能使更多的人更充分地使用已有数据资源,减少资料收集、数据采集等重复劳动。在高校数字化校园建设过程中,涉及的应用领域不断延伸,己覆盖了全校办公、教学、科研、人事、财务、实验、图书与后勤等各项事务,各个部门根据自己的业务需要,建设了各自的应用系统,基础数据在这些系统之间频繁的发生着联系。以学生基本信息为例,图书馆系统、财务系统、学工系统、教务系统、一卡通系统等系统都使用到它,各系统各自需要维护一份正确的学生名单,便产生了很多重复的录入,也同时增加了数据不一致的可能性。再则,学生基本信息也并不来自于同一部门、同一系统:学生从入学至离校期间各个系统都在不断补充、更新学生的基本信息,产生各种变化,如果没有确定一个权威的来源很难保证数据的统一。正是这些系统之间的互通需要对信息的共享与交换提出了要求[1]。
一、与学生相关的各系统之间的数据联系
1.新生入学
新生基本信息从招生系统开始直至迎新过程完成,期间与各个系统发生着密切的数据交换,各系统之间的数据联系如图1所示。
各系统工作基本过程描述如下:
(1)各省录取信息导入招生系统,获得新生基本信息,包括:考生号、姓名、性别、出生年月、民族、政治面貌、录取专业、通讯地址、录取地、联系电话、成绩、照片等个人信息,并产生录取号同时也作为学生在校期间的学号,完成录取通知书的打印。
(2)新生自助服务网获取带学号的新生基本信息,新生通过学号登录后补填身高、体重、鞋码、籍贯等信息,并把这些信息回填至学工系统。在教务系统完成分班,学工系统完成分宿舍后新生自助服务网获取新生的班级信息与宿舍信息。
(3)教务系统获取新生基本信息后分班,产生新生基本信息中的班级信息。
(4)学工系统将分班完成的学生划分宿舍,产生新生基本信息中的宿舍信息。
(5)一卡通系统获得新生的基本信息,并将一卡通卡号回填至学工系统。
(6)迎新系统获得新生的基本信息,并将产生的报到状态回填至教务系统、学工系统,如有补拍的照片,则回填至需要的系统。
(7)财务系统产生的财务缴费情况回填至教务系统、学工系统。
(8)图书馆系统获得已报到的学生基本信息,以学号作为读者号。
2.入学后至离校
学生入学后至离校,各系统之间的数据联系如图2所示。
各系统工作基本过程描述如下:
(1)教务系统每年根据财务系统的学费缴纳情况自动完成学籍注册。
(2)学工系统根据教务系统的数据更新学生的学籍状态,教务系统的成绩用于学工系统的评奖评优模块。
(3)根据教务系统的学生学制与年级确定离校系统中的离校生名单(不做毕业校验)。离校系统的部分环节是自动完成的:根据财务系统的欠费情况完成财务环节的审核;根据学生的组织面貌完成组织部环节的部分审核;根据图书馆的借还书情况完成图书馆环节的审核。
(4)学生离校环节全部完成后,返回离校标志到各个系统,表示该生已离校。
由此可见,学生从入学到离校,多个系统涉及学生信息,学生信息也在不断的完善与更新,经历动态变化的过程,仅依靠系统提供的数据导入导出功能进行操作难以保证学生信息的实时性与准确性。此外,系统与系统之间的多对多的数据交换也增加了数据流通的复杂度与难度。建立学生信息共享库,确定共享库中各项数据的权威来源,利用数据交换平台完成各系统与共享库之间的数据交换,不仅简化了数据交换过程,降低了数据交换难度,而且更能保证数据的实时性与准确性。
二、学生信息共享库的建立
学生信息是学生工作领域各系统运行的基础数据,它的更新也并非依靠一个业务系统完成,与各个系统都存在着联系。建立学生信息共享库,既能减少重复录入,也能明确学生各项信息的产生者与维护着,保证了数据的质量。共享库中以统一的代码标准存储学生信息,为信息共享与交换提供了前提,更利于将来的数据挖掘。
我校学生信息共享库的建设参照了教育部发布的教育信息化行业标准之《高等学校管理信息》中的GXXS学生管理数据子集。学校内部信息化的进程决定了共享库的建设是一个持续的过程,需要在实践中不断的进步与完善。目前,我校学生信息共享库的建设尚处于初期,已建设完成学生基本数据子类、学生照片子类、学生在校数据子类、学籍异动子类等九个数据子类,并根据校内业务的需要投入使用,各业务系统与数据中心学生信息共享库的数据交换如图3所示。
在学生信息共享库中涉及的各类代码,例如行政区划、性别、组织面貌、民族、家庭关系等代码参照教育信息化行业标准之《教育管理基础代码》,并在数据中心存储这些基础代码,如系统采用的代码与基础代码不同,则在系统中建立对照表进行转化后抽取至学生信息共享库。
我校将在未来逐步完善学生信息共享库的建设,后续将完成奖励子类、惩处子类、毕业生就业子类等数据子类,最终将存在数据的各个子类建设完整,并完成各系统与共享库之间的数据交换。在学生信息共享库的基础上生成高基321在校生分年龄情况,高基312普通本科分专业学生数,高基322招生、在校生来源情况,高基331学生变动情况等高基报表,实现数据的初阶应用,提高数据资源的使用效率。
三、信息传输与交换的实施
数据交换平台将各业务系统中需要贡献给学生信息共享库的数据自动抽取,也可根据需求将数据分发于各系统,实现共享库与业务系统之间的信息交换。
1.数据交换平台需解决的要点
异构性是数据交换必须面临的首要问题,其数据异构信息主要来自三个方面:系统异构、模式异构和逻辑异构[2]。系统异构是指数据所处的硬件平台、操作系统、网络环境等的不同;模式异构是指数据所处的DBMS本身的异构;逻辑异构主要是指数据的类型、命名、语义或结构等方面的不同[3]。我校的应用系统开发的时期不一样,采用了各自的数据库系统:学工系统、离校系统、迎新系统、教务系统采用的是Oracle,财务系统、图书馆系统采用的是Sql Server,再则,建立这些系统时也没有依据信息标准与规范,在数据语义、相同语义数据的表达形式等方面存在着差异,因此建立数据交换平台必须要解决这些异构数据库之间的数据交换。此外,业务系统与共享库之间的数据交换有些实时性要求比较高,需频繁的进行,有些仅需定时进行,因此建立的数据交换平台还需支持各种数据交换方式。在数据转换方面也需要能够实现各系统业务数据与共享库标准数据之间的转换,并对数据进行验证和质量控制。
2.数据交换平台的选择
数据交换平台既需要解决异构数据库之间的数据交换,也需要灵活的数据交换方式和可靠的数据转换,综合以上情况,我校数据交换平台采用Oracle Data Integrator(ODI)。ODI是一种全面的数据集成平台,涵盖了所有数据集成的要求:大容量,高效率批加载,事件驱动,SOA数据服务等[4]。ODI是以Java图形模块和调度代理访问的模块化信息库为中心进行组织的。图形模块用于设计和构建集成过程,代理用于安排和协调集成任务。数据管理员可以使用基于Web的Metadata Navigator应用程序来根据信息库中的元数据生成报告。现成的知识模块可以使用特定于平台的代码和工具跨异构平台提取和加载数据,并且支持灵活的数据交换方式。ODI使用检查知识模块(Check Knowledge Module)在数据源处充当错误数据的“防火墙”,只允许符合业务规则的数据进入集成流程。在源对象上定义一个或多个约束后使用检查知识模块来识别不符合这些约束的所有记录,并将它们复制到错误表中。在以后从这些源对象中提取数据并在接口中使用它们时,可以确保仅加载了符合这些约束的数据,并且可以单独处理错误表中的数据,以此来改进数据的质量[5]。