近些年,应用超级计算机完成大规模计算在材料科学领域中益发重要。无论是在新的电子器件设计、材料性质模拟,还是在纳米结构研究和电池充放电过程模拟等方面,超级计算机都功不可没。在高性能计算领域,艾级计算,即每秒完成1018次浮点数运算,是目前的研究热点及各国的竞争目标。艾级超级计算机一小时的工作,相当于普通个人电脑计算一万年的计算量。目前,中国在超级计算机的设备竞争中处于领先地位,其天河2号超级计算机蝉联全球TOP500第一名,但在软件开发上还有待进一步提高。天河2号的计算能力很难被传统软件所利用,已有软件不足以发挥其超强计算能力。超级计算机的强大能力不只是依靠增加单个计算机核的速度来得到的,单个计算机核的速度增长在差不多十年前就已停滞了。目前的超级计算机是采用几十万乃至上百万处理器并行的结果。如此级别的大规模并行计算给软件开发人员带来了巨大挑战。如何有效利用大规模的超级计算机是高性能计算领域中亟待解决的问题。
最近,美国劳伦斯伯克利国家实验室的资深科学家汪林望博士在 National Science Review 发表综述文章(全文链接:http://nsr.oxfordjournals.org/content/1/4/604.full),回顾了大规模材料计算的历史和现状。针对第一原理材料模拟,他提出一种融合物理机制和异构机器架构的“分而治之”的算法。在超大规模计算机软件设计时,关键是减少全局通信,将通信限制在局域处理器之间。量子相互作用的短程局域性使研究人员能够把一个大的物理系统划分为很多分离的小片(分片),然后再对每一分片分别进行计算。通过这种方式,不同组的处理器可以计算不同系统分片,从而把通信限制在单组处理器内部。这一算法的关键是找到将不同系统分片拼接而得到最终结果的方法。汪林望博士在此提出了一种可以将人工分片的边界效应抵消的算法:线性扩展三维分片法(LS3DF)。
除了这一“分而治之”的模式,超级计算机的另一挑战是如何有效利用其加速部件。中国的天河2号采用MIC作为其CPU加速部件,而TOP500排名第二名的美国的泰坦超级计算机采用了图形处理器(GPU)作为其加速部件。加速部件减少了机器的耗电量,对大规模超级计算机极其重要。但是相比CPU而言,MIC和GPU采用不同的编程方式,其内存结构和指令设置也与原有架构有所区别。这样的异形架构大大增加了计算的复杂性。汪林望博士同中国科学院超级计算中心研究人员一起将平面波密度泛函理论计算的CPU软件PEtot开发在GPU平台上(取名为PWmat),使其速度增加了20倍。将GPU计算应用于LS3DF算法将加快解决众多大规模(上万原子系统)材料科学问题。该文中提供了多个如此模拟的计算案例。
了解最新科研进展,请关注《中国科学》杂志社公众微信
搜索:scichina1950 或 中国科学杂志社
转载本文请联系原作者获取授权,同时请注明本文来自科学出版社科学网博客。
链接地址:https://wap.sciencenet.cn/blog-528739-856662.html?mobile=1
收藏