近日,在国家理论化学计算重点实验室吉林大学理化所的高性能计算集群设备招标中,曙光公司在次力压群雄一举夺标。
近日,在国家理论化学计算重点实验室吉林大学理化所的高性能计算集群设备招标中,曙光公司在次力压群雄一举夺标。吉林大学理化所是理论化学计算国家重点实验室,1989年在唐敖庆院士建议下国家计委批准在吉林大学建立理论化学计算国家重点实验室,也是我国唯一从事理论化学基础研究的国家重点实验室。针对吉林大学理化所的高性能机群主要面向整个理化所提供高性能服务的要求,曙光公司的技术方案采用了基于上海超级计算中心曙光4000A/5000A(这两套系统分别在2004年和2008年获得全球超级计算机排名前十,也是中国高性能计算机的最好成绩)的设计、实施及运营的成功经验,其设计原则是:高性价比、高稳定性、面向多种应用计算类型。而从实际应用角度来讲,无论是计算能力、管理能力还是以后的扩展能力都达到了非常高了水平,得到了客户的高度评价。
首先是计算能力,整个系统的计算节点采用业界先进的曙光天阔服务器I620r-F,配置Intel Xeon 64位处理器的架构,具有8个处理内核(2.66GHz,12M L2 Cache),16G DDR2 667MHz内存,2块146G 15Krpm SAS硬盘。整个高性能计算机的双路计算模块为128个,可以提供强大的浮点运算能力和定点运算能力(10.895万亿次),完全可以满足系统运算能力的需要;双路节点主要是满足常规计算的计算池,实验室的常规计算需求可以在该部分完成。作为一个综合性的适于多种应用的计算中心,曙光在方案中建议有2台8路和2台四路节点作为不同应用和性能的SMP节点,这样可以扩大整个系统的适于范围;可以适于与某些特殊需求或者极端条件下的算例的计算,例如超大规模体系和高精度计算。计算网络、存储网络都采用千兆以太网,提供全线速连接;而管理网络也采用千兆网络,满足管理软件的带外管理的需求,同时也提供计算网络的备份。
在管理能力方面,整个系统完全符合SUMA标准,即具有可扩展性(Scalability)、可用性(Usability)、可管理性(Manageability)和可靠性(Availability)四个方面的特性。机群管理系统尽量采用并发机制,并且能够对新增节点提供配置、管理的功能,使其满足机群内节点的基本配置条件,自动纳入管理范围。曙光机群管理系统软件(Gridview)是为国内首台百万亿次的曙光5000超级计算机开发研制的,可以对超过2000个节点的超大规模机群进行web方式的带外管理和部署。它是一套多功能、易使用、可扩展的实用化机群管理工具,支持异地管理,异构机群统一管理和报表功能。系统管理功能采用模块化形式,能够按用户的需求伸缩管理配置功能。曙光作业调度系统支持Web界面提交、作业记账和统计功能等功能,在可以区分串行作业及并行作业的不同需求,支持用户作业数和作业规模限制。支持多种调度队列和调度策略配置,能够满足大规模机群的应用。我们同时也提供TORQUE/PBS作业调度系统,可以满足标书所有要求,同时可以限制用户不能在节点上登录,以及X-windows界面的监控管理界面。
另外值得一提的还有这套系统的扩展能力,当任务量增加,需要增加计算单元时,只需要简单扩充增加计算节点即可,这样保证了整体架构保持不变,保护了用户当前的投资,而且保证了系统的完整性;机群群操作系统和机群系统软件可以无缝扩展,无须另外购买即可将扩容的节点机纳入当前的系统中进行管理、调度;而且同时支持异地异构机群及带外管理。为客户带来了极大的方便。
关于吉林大学理化所:
吉林大学理化所实验室于1995年11月通过国家验收,1996年2月经原国家教委批准正式对外开放,1999年7月通过首次国家评估。
六十年来,在我国理论化学奠基人唐敖庆院士的领导下,吉林大学逐渐形成了我国的理论化学中心。1978年经国家科委批准,在吉林大学建立了理论化学研究所,唐敖庆院士任所长。目前我国从事理论化学研究的大多数高级科研工作者都直接或间接在吉林大学理论化学研究所学习和进修过。1989年在唐敖庆院士建议下国家计委批准在吉林大学建立理论化学计算国家重点实验室,也是我国唯一从事理论化学基础研究的国家重点实验室。首任实验室主任为孙家钟院士,唐敖庆院士为实验室学术委员会主任,实验室于1995年11月通过国家验收,1996年2月经原国家教委批准正式对外开放,1999年7月通过首次国家评估。通过首次国家评估后,实验室进行了换届,学术委员会由国内著名理论化学家17人组成,其中中科院院士8人。实验室现有固定人员22人(院士2人,具有博士学位13人),固定人员的科研成果曾获2000年国家自然科学奖二等奖,2001年中国高校自然科学奖一等奖,2003年吉林省科学技术进步一等奖。