随着高校信息化的发展,校园的日常运营越来越离不开数据中心的支撑。为数据中心提供一个稳定、安全、高效的网络环境成为当前高校网络建设的一个重要课题。 “分布式多活”数据中心的网络是一个实现前端业务多活、后台资源共享和数据互为备份的网络基础平台,能够有效保证高校数据中心的业务连续性和数据安全性。本文以厦门大学为例介绍了基于“分布式多活”高校数据中心网络的研究与设计。
一、引言随着云计算、大数据技术的广泛运用,人们对数据中心和网络的依赖程度越来越高。“分布式多活”数据中心具备零中断的业务连续性、零丢失的数据安全性和灵活的服务扩展性,因而成为当前大中型数据中心建设的热点模式。[1]所谓“分布式多活”数据中心指的是将分布在多个地点的数据中心整合起来,多个中心之间地位均等,在逻辑上将它们视为一个全局的大数据中心,建立基于全局大中心的统一管理平台实现跨多个数据中心的资源调度。正常情况下多个数据中心协同工作,并行地为业务访问提供服务;当某个中心发生故障时,其他中心可以正常运行并对故障中心的业务进行接管。[2]与传统“主/备”或“两地三中心”模式的数据中心相比,“分布式多活”数据中心具有明显的优势:
1.资源利用率大幅提高
传统模式下,备份中心在网络、存储、服务器、系统等软硬件配置上与主数据中心相同,但仅在主数据中心出现故障时产生作用,资源平时无法复用,建设成本高,利用率却很低。“分布式多活”模式下,多个数据中心地位均等,并行地协同工作,每个数据中心的资源都得到了充分利用,避免了资源浪费。
2.灾难恢复能力等级[3]高
传统模式下,数据中心发生故障时,RTO(Recovery Time Objective,恢复时间目标)与RPO(Recovery Point Objective,恢复时点目标)一般为数小时或更长时间,容易造成业务访问的长时间中断和数据的丢失。“分布式多活”模式下,当故障发生时,各个数据中心间的业务接管和切换几乎是实时的,即RTO≈0,多个中心之间的数据实时互为备份,即RPO=0。其灾难恢复能力等级达到最高级别第6级。[4]
3.业务系统的高可用性
传统模式下,主数据中心正常运行时,灾备中心一般只做数据备份,不承担业务应用。主中心故障时,业务应用切换时间长,造成业务访问的中断,严重影响用户体验。“分布式多活”模式下,相同的业务系统可以部署在多个数据中心内并行地提供服务,实现业务访问的前端多活。一般情况下,其服务能力往往双倍甚至数倍于主备模式。[5]充分保证了业务系统的高可用性。
鉴于“分布式多活”数据中心的先进性,厦门大学计划将校园数据中心转型为“分布式多活”模式。首当其冲的任务就是对原有数据中心的网络进行“分布式多活”的设计与改造。
二、案例数据中心情况简介
本文以厦门大学校园数据中心为例。目前厦门大学现有三个B级[6]数据中心机房,其中主数据中心位于思明校区,拥有服务器400多台,运行着包括校园信息化、教务、金融一卡通等40多个业务系统;同城灾备中心位于翔安校区,负责对主中心的业务系统数据进行定期备份;异地灾备中心位于漳州校区,当厦门发生区域性灾难时能将思明校区主中心的核心业务系统切换至漳州校区灾备中心。在数据中心的部署上厦门大学采用了传统的“两地三中心”模式。网络方面三个校区数据中心机房的网络核心交换机均通过专线连接到思明校区主中心机房的某品牌企业级核心交换机上,其中思明、翔安由两条万兆专线连接,漳州由六条千兆专线连接。三个中心之间的交换数据实时转发,交换带宽最高可达720Gb。
近年来随着校园各项业务数字化的不断深入,学校的日常运营和广大师生的工作生活都已离不开数据中心和网络的服务与支撑。尽管校方不断加大对数据中心的建设投入,可由于数据中心采用的传统部署模式,其灾难恢复能力等级只能达到第4级,即RTO与RPO需要数小时至一天,这已不能满足当前和未来学校对数据中心业务连续性的需求;[3]而且随着建设资金的持续投入,两个灾备中心的资源利用率却始终很低,无法达到预期的投资回报。为了解决上述问题,厦门大学将建设“分布式多活”校园数据中心列入工作计划。这是一项复杂的系统工程,需要对原有数据中心的网络、数据、系统、应用等各个方面进行设计和改造。本文中笔者对“分布式多活”数据中心的网络平台的设计与建设进行了分析与阐述。
三、“分布式多活”网络的建设要素
“分布式多活”的网络环境是一个能够满足数据中心有效扩展、分支部门灵活接入和业务系统快速部署的弹性高可用网络。建设中应考虑以下四个要素:①核心网,核心网是“分布式多活”数据中心的基础支撑网络,是多中心资源调度和互访的高速通道,负责实现各个业务部门与数据中心的互联。②数据中心架构,数据中心架构分为数据中心内部网络和数据中心间互联两个部分。前者描述单一中心内部网络架构,后者描述各中心之间网络如何互联以实现多中心间资源的最优调度。③业务接入选择,业务接入选择应考虑业务接入的高可用性、接入最优路径选择和业务流量的合理分配。④终端接入方式,终端接入方式主要解决两方面问题。一是保证业务部门的终端用户能够快速便捷安全地接入核心网络;二是保证业务部门内部终端能够灵活扩展。