|
|
|
|
移动端

2.3.3 计算环境

《高性能并行珠玑:多核和众核编程方法》第2章从正确到正确&高效:Godunov格式的Hydro2D案例学习,本章将探讨一段科学模拟代码,这段代码是一个以气体动力学为基础的模拟程序。这份程序的输出结果正确,但(初始版本)性能欠佳。本节为大家介绍计算环境。

作者:张云泉 等译来源:机械工业出版社|2017-11-14 17:37

技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战

2.3.3 计算环境

Intel xeon E5-2680处理器。它是基于x86架构的新一代众核服务器架构多核处理器。这种处理器有超标量,乱序执行的内核,这种内核支持两路超线程。除了标量单元之外,它还有一个256位宽的SIMD单元(用于执行AVX指令集)。分离的乘法和加法端口允许一条加法指令和一条乘法指令(每个都4位宽,双精度)在一个周期中完成。本章考虑的是2嵌套字、16核配置。

Intel Xeon Phi协处理器。这种处理器的一个重要特征是单个裸芯片上有很多按序执行内核。每个内核支持4通道多线程,这种结构能够隐藏多周期指令和内存访问的延迟。协处理器中的内核是顺序执行的,每个周期都发出不超过一个向量指令,同时运行的频率比处理器低。这些内核有特殊的51位宽的向量指令集,同时支持融合乘加(FMA),这使它们能够执行8位宽双精度乘加操作。本章使用的是预生产的芯片。

协处理器在物理上安装在PCIe卡上,同时使用了GDDR内存和Linux操作系统。本章中,我们要原生地在协处理器上运行实验——二进制和输入要与卡共享,并且完全运行在这上面。

更多的信息在图2-3上表示。一级和二级缓存的大小对于处理器和协处理器来说都是针对每个内核的,三级缓存对于处理器是针对每个内核的,但是在片上所有内核之间是共享的。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

《广域网》

在开始学习WAN资料时,我经常面对资料深度不够或者为电气工程师编写的书。另外,在看了几本书,并且对Internet进行了研究以后,我觉得应当...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊