|
|
|
|
移动端

3.3 HBM执行配置文件

《高性能并行珠玑:多核和众核编程方法》第3章HBM上的SIMD与并发优化,本书中展示了如何在处理器和协处理器上进行并行处理和编程——展示了更好利用Intel Xeon Phi协处理器和Intel Xeon 处理器或其他多核处理器的系统计算潜力的最有效的方法。本节为大家介绍HBM执行配置文件。

作者:张云泉 等译来源:机械工业出版社|2017-11-14 18:08

技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战

3.3 HBM执行配置文件

作为一个向着HBM更高效执行力度发展的准则,实际应用中的HBM代码执行时间中不同部分的执行时间所占比重如图3-1所示。其中平流示踪部分的时间占到了总时间的44%,因此它是项目中最主要的部分。实验的结果表明可以通过盐度和温度两种示踪方法得到纯物理运行过程。对于运行像MyOcean这样的应用需要额外的12个示踪剂表示生物地球化学的变量,平流示踪的运行时间约长2.5倍。在任何一种情况下,通过优化平流示踪部分性能来进一步优化HBM整体性能的方案似乎非常合理,平流示踪部分优化有以下两种方法:一个是提出一个可实现的新的、更简单、更高效的方案;另一个是尝试提高现有较为复杂方案的性能。由于以下几个原因,第一种优化方案难以实现,因此提高当前方案的性能是优化像HBM这样的通用模型代码的唯一出路。

对于示踪物平流而言,使用中心差分法或纯迎风格式的相对粗粒度网格划分,可能导致偏差甚至错误的预测结果。总偏差递减(TVD)方案(Harten,1997)能够预测更陡的峰值并保持不含寄生振荡的单调性(没有“超调”)。但是这些TVD的性质往往难以甚至不能证明通用多维方案的存在,因此应用中的每个坐标方向通常使用一维坐标系保持某种单调性。毫无疑问,任何物理引力模型必须具备质量守恒和单调性。即使是应用在可能发生空间和时间上诸如干燥和湿润骤变的自由表面流动上时,如果能够满足以下两个基本条件(Gross等,2002),的确能够使用一些示踪物平流方法解决。第一个条件是满足一致性和连续性(CWC)概念,即要求离散的示踪物平流方程与离散的自由表面连续方程保持一致;另一个重要条件是在网格单元格表面适当定义变化的高通量。

Kleine(1993)研究并提出了HBM上示踪物平流的实际数值方法。本文作者实现了一种高并发的数值方法,该方法对CWC概念和带有多个示踪物的动态双向嵌套配置的高通量进行了适当修改和调整。此外,作者还调整了所有使用间接寻址方式的数据结构,添加了对MPI和OpenMP的支持,以及使用单指令多数据(SIMD)向量以优化并发性。在BSD授权下,读者可下载、使用本章的特定代码以及与HBM(非完整代码)相关的部分代码。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

Ubuntu Linux入门到精通

本书全面介绍了Ubuntu Linux的相关知识,内容详实,论述清晰。主要内容包括Ubuntu介绍、文件系统管理、进程管理、压缩与查询系统、Shel...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊