瑞士名校怎么搞HPC 华为有一套方法论

吴玉征 2017-08-10 18:56 阅读:44
摘要:空气动力学、空间技术的开发;长期气候预测、高精度天气预报、海洋环流计算、空气与水污染的模拟分析、洪水与地震等灾害的预报;发动机设计、模具设计、生物新药设计、风洞试验仿真、石油地质勘探及新材料研究……所



空气动力学、空间技术的开发;长期气候预测、高精度天气预报、海洋环流计算、空气与水污染的模拟分析、洪水与地震等灾害的预报;发动机设计、模具设计、生物新药设计、风洞试验仿真、石油地质勘探及新材料研究……所有这些与HPC(High Performance Computing,高性能计算)都紧密相关。

发展速度极快、应用愈发广泛,这就是 HPC当前的现状。之所以会呈现这样的态势,主要是出于两方面的原因。一是需求促使,当下是数据社会,数据量越来越大、再加上人们对数据分析效率的追求越来越高,需要更强大的计算力做支撑;二是技术进步,信息技术这些年发展很快,HPC资源的获取之前需要大量的人力、物力投入,而现在以比较小的代价就能享受其强大的能力。

二者相互交织、促进,使得越来越多的行业开始使用HPC,感受HPC带来的变革。这其中,高等教育行业绝对是一个典型。粗略统计了一下今年6月发布的全球高性能计算机(HPC)TOP500榜单,其中有41套归属于大学,占比超过8%,分量可想而知。

为什么高教行业对HPC的需求那么强烈?与HPC快速普及的原因一脉相承,但高教的特点更突出。

拿汽车制造业来说,汽车生产企业会利用HPC进行车辆设计,而高校也会有相应的课程,也会用到HPC,二者都有需求。所不同的是汽车制造商只利用HPC干汽车制造这一件事,而高校还会有物理、化学、生物等其它学科需要HPC的能力。也就是说,相比企业,高校在HPC领域的应用范畴更广。到此,也就不难理解为什么HPC能在高教行业发展如此之快了。

EPFL出难题



为了更进一步探讨高教对HPC的使用情况,这里举一个实际案例,瑞士洛桑联邦理工学院(EPFL) 。



EPFL,世界顶级高校,QS世界大学排名第12,工程技术领域和自然科学领域享有极高的声望,拥有来自全球120个国家和地区的学生、教授和职员。为了保持业界领先的科研水平,EPFL一直在加强HPC系统的建设,早在2008年就建设了第一套HPC系统服务于全校师生。



着眼于未来的竞争力提升,从去年开始EPFL就计划对其HPC系统进行升级扩容。升级的理由很简单,资源不够用了。在EPFL给出的需求表中,最显眼的一栏是应用需求,HPC benchmark,HPL,HPCG等基准测试要满足;科学、工程、生物、医疗等各种应用,其中既有EPFL自行开发的也包括开源的都要能运行。

除此之外,还有很多硬性条件,比如理论计算能力≥475TFlops,共享存储≥340TB,读写带宽40G/s,整个系统不能超过8个机柜,单机柜功耗不能高于25kw;系统要开放、易管理、易扩展,而且合作伙伴要有足够的技术前瞻性,能为EPFL未来5年建设5PF HPC集群的总目标提供足够的支撑力。



华为见招拆招



单独看某一方面的需求可能还比较好满足,但如果把所有需求都集中在一起,会发现这块骨头并不好啃。没有压力也就没有动力,华为和当地系统集成商Transtec迎难而上经过多次详细分析,最终给出了现在的方案,拓扑图如下:



其中,计算节点408个FusionServer XH620,每个节点是两路至强E5-2690 v4处理器,理论计算峰值475.2TFlops,网络采用2层Fat-Tree组网,Infiniband高速网络,存储系统是6套OceanStor 5800+GPFS并行文件系统,容量计350TB。

在这套方案中,华为采用了很多领先的产品和技术,带来的效果也十分显著。比如华为X6800高密度服务器的应用,使得单机柜计算能力提升70%的同时,机柜的部署数量也节省了40%。因为X6800在4U空间内能最高容纳8个计算节点、16路处理器,而采用普通的1U双路服务器则需要8U空间。这样一来,408个计算节点只需要6个机柜就能满足,而不是10个。

再比如,X6800中采用的散热工程设计,再加上DEMT动态节能技术,使得能耗比传统机架服务器降低10%-20%。

更多特性不再一一列举。凭借高效、高性能、高可扩展性、易管理等特性,华为的这套方案受到认可并得以部署。而从现在的实际应用情况看,这套方案完全满足用户需求,402TFLOPS的实测数据,计算效率达到89.3%。





今年6月,EPFL与华为共同宣布其科学IT和应用支持(SCITAS)部的Fidis HPC集群成功上线。



EPFL SCITAS执行董事Vittoria Rezzonico女士在接受采访时对华为给予高度评价。她说:“Transtec和华为紧密合作,为EPFL提供了一个顶级高质量的系统,很好地满足了我们在高性能计算学术领域的需求。华为技术工程师为我们介绍的出色的硬件解决方案以及Transtec专业的规划、安装和配置服务,让我们印象非常深刻。”

一切源于实力

从这个应用案例中能明显看出两点,一,EPFL虽然是个案,但反映的是几乎是所有高校的诉求,那就是高校HPC的应用范围很广,对HPC的需求很强烈。二是高校的对HPC系统的要求很严苛,应用多,而且受限于场地等多方面的限制,对解决方案提供商的能力要求极高。所以,从另一层面看,能接下并完成这样高难度的项目也体现了华为HPC的实力。

事实上,在EPFL这个项目中的表现可以视为华为HPC这两年发展的一个缩影,能力提升快、市场拓展快。看看下图就能明白华为在HPC领域的进步有多快。





2013年HPC TOP500榜单中只有华为一套系统,即便到了2015年也只有两套,但是2016、2017两年迅速攀升到了16、20套。毫无疑问的是,华为HPC已经展现出了极强的竞争力,示范效应开始显现。

据悉,华为HPC已经实现了广泛的行业覆盖,并有很多标杆性的客户,比如大学TOP15的客户中有四个是华为的,国家级超算中心华为参与建设了20个,TOP3的制造业客户中有两个选择了华为,在能源行业,华为更是拿到了第一名。

这就是华为,不鸣则已一鸣惊人。当它认真投入做一件事情的时候,势必爆发出不一样的能量,HPC如此,服务器、存储、网络均如此。假以时日,华为HPC能达到怎样的高度?不可估量。

最后值得一提的是,在9月即将召开的华为全联接大会2017上,华为还将有劲爆的HPC产品发布。是什么?现在还不得而知,但必定会给华为HPC的发展再添砖加瓦,不知道下一次HPC TOP500榜单发布时,华为会交出怎样的成绩单,值得期待。



版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
阅读量: 44
0