美国当地时间11月15日,当组委会赛事主席约翰·卡泽宣布清华大学计算机系超算团队获得2018国际大学生超级计算机竞赛(SC18)冠军时,观众席上几位身穿蓝色队服的年轻人攥住了拳头,兴奋地蹦起来。 总分88 398分(满分100分),高出第二名新加坡南洋理工大学11 518分。这是清华大学计算机系于纪平、余欣健、何家傲、郑立言、赵成钢和交叉信息院娄晨耀6名本科生的最终成绩。 至此,在2018...
美国当地时间11月15日,当组委会赛事主席约翰·卡泽宣布清华大学计算机系超算团队获得2018国际大学生超级计算机竞赛(SC18)冠军时,观众席上几位身穿蓝色队服的年轻人攥住了拳头,兴奋地蹦起来。
总分88.398分(满分100分),高出第二名新加坡南洋理工大学11.518分。这是清华大学计算机系于纪平、余欣健、何家傲、郑立言、赵成钢和交叉信息院娄晨耀6名本科生的最终成绩。
至此,在2018年三大国际大学生超算竞赛ASC、ISC和SC中,清华大学超算团队包揽了全部三项竞赛的总冠军,实现了继2015年后的又一次“大满贯”。这也是清华大学超算队伍在此三大国际性大学生超算竞赛中累计获得的第11项冠军。
挑战,从赛前开始
据了解,全球超级计算大会(SupercomputingConference,简称SC)是国际超算领域的顶级会议,国际影响力巨大。作为会议的重要组成部分,SC比赛是超级计算机领域的顶级赛事,每年举办一次,吸引着世界很多国家和地区的众多高校学子。
在本次被行内誉为超算界的“F1竞赛”中,共有来自全球15所高校的本科大学生组队参赛,清华大学是唯一一所参赛的中国内地高校。参赛选手不仅需要拥有先进的硬件设备,还要对相关科学领域的应用有深刻的理解,在高性能计算方面有扎实的基本功,以及极佳的现场应对策略及语言表达能力等。
今年暑假,作为此次比赛的队长,于纪平就开始联系赞助,和学校协调机器的各种问题。
对于刚上大三的郑立言来说,这次是他第一次去现场参加比赛,内心非常激动。和其他队员比起来,开朗的郑立言如他的名字一般能言善道。他在比赛中负责现场回答有关核裂变链式反应的稳态求解与模拟的相关问题,以及团队项目的演讲,他因此还提前看了很多核物理方面的书。
参加比赛的过程并不是一帆风顺。出发前,本来集结好的6人队伍却由于主力队员唐适之的签证问题,不得不在行前临时更换了成员。这迫使团队把早已计划好的比赛策略推翻重来。于纪平回想起当时的情景,“心里本来挺没底的,但还是要硬着头皮上,相信大家的实力”。
这对于“临危受命”的大四学生余欣健来说同样“惊险”。沉稳,不善言谈,脸上总挂着微笑的他给人的第一印象就是“靠谱”。的确,他去年参加过大型比赛,经验丰富,队友如今对他的评价也是“五星好评”。
“比赛前两天的下午,我刚下课就接到老师打来的电话,他问我有没有时间参加SC,我问什么时候走?老师说是后天。第二天我就赶紧去办出国的手续,和队员们了解了这次的比赛内容,第三天就出发了。当时的感觉是很忐忑,希望不要拖后腿。”余欣健对中国青年报·中青在线记者说。
48小时的战役
美国时间11月9日晚上,团队抵达美国达拉斯。
“我们周五把机器装箱打包运到美国,周六周日一直在安装机器,调试到最优的状态。”翟季冬介绍说,周一早上先进行基准测试程序,测到下午5:30。在这之后,周一晚上7:00开始到周三晚上7:00为正式比赛时间,要求机器运行48小时不间断,不能再对机器进行任何配置的修改。
在这48小时中,参赛队伍需要在3000瓦功率内搭建计算机集群系统,并在集群系统上进行6个应用程序的性能比拼。除了考察成员的计算机“脑力”,比赛设置了采访、参会、海报设计等环节,成员需在比赛中向评委介绍自己优化的应用和正在进行的软件优化设计。团队还需要在48小时内完成一篇在国际权威杂志具有发表能力的英文论文。
与其他两个大赛不同的是,SC大赛还有随机断电环节的设置。
“什么时候断、断几次都是未知。”于纪平告诉中国青年报·中青在线记者。正因为如此,他决定48小时不离开比赛现场,甚至睡在地上。
一次,队友在比赛场地找不到于纪平,几个人转了一圈才发现,这个身高超过180cm的大小伙子正蜷缩着身子,睡在了一个宽仅有60cm左右的长桌下面,撩开桌布才能看见。“其实比赛中是可以回酒店休息的,但是回去需要步行20多分钟,我不放心,所以干脆就睡在这了。我们要保证48小时场地里始终有醒着的人”。
这次大赛是在第一天晚上12点断电。断电后组委会要求所有参赛队伍把插头拔下来检查。团队除了拔插头不能进行任何操作。于纪平表示,当时机器的一个链状结构出现了问题,由于比赛规定不能碰机器,不能检查线缆,只能通过远程的方式检测。“我们正在排查故障的时候断电了。断电重启后,故障竟然消失了”。
幸运不会一直陪伴着团队,随着比赛的深入,挑战接踵而来。
比赛期间,比赛规则的突然调整让经验丰富的于纪平也措手不及。于纪平回想起当天的“惊险”经历仍然心有余悸。“因为HPL(直译为高性能线性系统软件包)跑完电脑功耗已经很大,电脑过热将影响紧接着的HPCG(直译为高性能共轭梯度)的速度。连续跑完两项测试大概需要40分钟到1个小时的时间,大约下午4点半我得到的结果我不太满意,所以又重新跑了一次,很惊险地在结束的那一刻上交了成绩。”
兴趣是最大的战斗力
对于这些年轻人来说,输与赢并不会改变他们与老师同学们的关系,也不会让他们省去比赛期间耽误的考试和作业,更不会改变他们对于超算的热爱和梦想。兴趣,成为这个团队成员的最大动力。
正如成员郑立言所说,“我们要让一个程序不停地优化,让它跑得更快,还要降低功耗需求,我觉得特别有趣。”
“从进入清华就拜托班主任打听超算团队了。”大学刚入学,成员赵成钢就对超算产生了浓厚的兴趣,从参加组会、熟悉规则到做外围支援,从优化程序、操控机器到训练临场应变,一年多之后,刚刚上大学二年级的他就进阶为正式队员。
翟季冬介绍,同学们在日常培训中会表现出不同的兴趣。“比如纪平、欣健对硬件感兴趣,成钢、晨耀在程序优化和程序分析方面有很大的发挥空间,立言和家傲的英文表达非常好……我们会在比赛中极力去发掘和培养他们的特长。”
然而在清华,即使是参加这种规格的国际赛事,老师们也不会允许同学们落下应该完成的功课。于是在比赛现场和返程的飞机上,郑立言、何家傲等人一直在写作业。
“赛前、赛中、赛后,我最大的感受就是缺觉。”郑立言笑着对中国青年报·中青在线记者说,当时机器在身边跑着程序,等待中的他便开始写“编译原理”等课程的作业。这两天,他每天都是凌晨4点才睡,仍是为了写作业。
比赛的收获也可以是感性的。郑立言说,收获有很多方面,除了在与专业人士的交流上,还有友谊上的收获。“这14支参赛队,有的队伍中华人比较多,我们在比赛中和其他的选手也有很多交流,赛前、赛中我们会讨论解决技术问题,比赛后我们还会一起加微信、约吃饭,我们通过这场比赛与选手们结下友谊。
在比赛的过程中,团队成员们也对自己的未来规划有了更深的认识。
何家傲告诉中国青年报·中青在线记者,这次比赛中自己有幸聆听了多场讲座,“一位高性能计算领域的行业专家给大家分享了自己的专业如何为社会贡献。这些前辈的人生历程很具指导作用。我才发现原来自己有很多事情可以去做。我现在研究记忆学习,经过这一次比赛的经历,我明白了自己未来可以在哪些方向发力。”