|
|
51CTO旗下网站
|
|
移动端

3.4 HBM优化综述

《高性能并行珠玑:多核和众核编程方法》第3章HBM上的SIMD与并发优化,本书中展示了如何在处理器和协处理器上进行并行处理和编程——展示了更好利用Intel Xeon Phi协处理器和Intel Xeon 处理器或其他多核处理器的系统计算潜力的最有效的方法。本节为大家介绍HBM优化综述。

作者:张云泉 等译来源:机械工业出版社|2017-11-14 18:09

【51CTO技术沙龙】10月27日,让我们共同探索AI场景化应用实现之道

3.4 HBM优化综述

为了阐述我们的观点同时简单化不必要的事情,我们将不会处理有关嵌套、气象预报领域及本章提到的其他预报数据等。这些可能会限制其在代码中的使用,但是我们希望能在真实环境的3维数据集中展示我们的研究成果,而不是局限于学术研究中。因此,我们将程序应用在巴芬湾的所有相关数据上,这些数据是从免费的ETOPO2数据集中免费获取的。(URL详见3.13节。)

下一节首先将介绍最重要的且不同于其他环流模型代码的数据结构,然后将描述HBM的线程并行化与SIMD向量化过程。此外,我们详细处理了一些零碎的优化障碍和不明显的优化效果。最后我们结合了多种优化方法并在Intel Xeon处理器和Intel Xeon Phi协处理器上进行性能分析对比。这种特殊应用的实验结果表明,与Intel Xeon处理器相比,我们在一个Intel Xeon Phi协处理器上获得了15%的性能提升。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

程序员密码学

《程序员密码学》涉及密码学的各个研究方向,分组密码、散列函数、公钥密码以及相关的攻击,同时也讲解了密码学算法实现上常用的ASN.编码、...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊