|
|
51CTO旗下网站
|
|
移动端

3.12 总结

《高性能并行珠玑:多核和众核编程方法》第3章HBM上的SIMD与并发优化,本书中展示了如何在处理器和协处理器上进行并行处理和编程——展示了更好利用Intel Xeon Phi协处理器和Intel Xeon 处理器或其他多核处理器的系统计算潜力的最有效的方法。本节为总结。

作者:张云泉 等译来源:机械工业出版社|2017-11-14 18:34

3.12 总结

本章中使用的许多技术和优化思路具有广泛的适用性:对于数据局部性问题可以使用线程和向量化技术。本章中所采用的思维方式可供设计高性能应用程序的程序员借鉴。这样优化后的程序才能在Intel Xeon处理器和Intel Xeon Phi处理器上都获得性能提升。

我们认为只有专注于数据邻近性的实现才能获得硬件模型上良好的SIMD和线程性能。在HBM模型中一直使用面向数据的设计能获得较好的性能。如果要选择符合并行的大气环流模式代码,数据结构的设计是最基础也是最关键的部分。在使用SIMD向量化代码的过程中不要忽略了克服琐碎的和一些不那么明显的障碍。技术虽然都可以在Intel Xeon处理器和Intel Xeon Phi协处理器上使用,但是协处理器的总内存带宽更大能够使程序获得更好的扩展性。对于本章的特殊应用,相对于在单节点Intel Xeon Phi协处理器上,在Intel Xeon处理器上获得了15%的性能加速比。Intel Xeon Phi协处理器上的功耗效率是非常吸引人的。虽然协处理器卡的内存限制现在是获取更好性能的瓶颈,但是我们相信在下一代的Xeon Phi 协处理器(Knights Landing)上这一问题会得到明显改善。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

开源osCommerce 轻松架设专业电子商务平台

osCommerce是一款免费的、开放源代码的专业电子商务解决方案。本书以通俗易懂的语言向读者展示了该软件强大的功能和简易的操作方法,主要内...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊