|
|
51CTO旗下网站
|
|
移动端

目录(2)

《高性能并行珠玑:多核和众核编程方法》本书由英特尔的技术专家撰写,全面、系统地讲解在英特尔至强处理器和至强融核协处理器上进行并行处理和编程的方法和技术。书中展示了如何在处理器和协处理器上进行并行处理和编程——展示了更好利用Intel Xeon Phi协处理器和Intel Xeon 处理器或其他多核处理器的系统计算潜力的最有效的方法。本节为目录。

作者:张云泉 等译来源:机械工业出版社|2017-11-14 17:19

目录(2)

第9章 N体问题直接法的众核实现  125
9.1 N体模拟  125
9.2 初始解决方案  125
9.3 理论极限  126
9.4 降低开销和对齐数据  128
9.5 优化存储层次  131
9.6 改进分块  133
9.7 主机端的优化  135
9.8 总结  136
9.9 更多信息  136
第10章 N体方法  137
10.1 快速N体方法和直接N体内核  137
10.2 N体方法的应用  138
10.3 直接N体代码  138
10.4 性能结果  141
10.5 总结  142
10.6 更多信息  142
第11章 使用OpenMP 4.0实现动态负载均衡  144
11.1 最大化硬件利用率  144
11.2 N体内核  146
11.3 卸载版本  149
11.4 第一个处理器与协处理器协作版本  150
11.5 多协处理器版本  152
11.6 更多信息  155
第12章 并发内核卸载  156
12.1 设定上下文  156
12.1.1 粒子动力学  156
12.1.2 本章结构  157
12.2 协处理器上的并发内核  158
12.2.1 协处理器设备划分和线程关联  158
12.2.2 并发数据传输  163
12.3 在PD中使用并发内核卸载进行作用力计算  166
12.3.1 使用牛顿第三定律并行评估作用力  166
12.3.2 实现作用力并发计算  167
12.3.3 性能评估:之前与之后  171
12.4 总结  173
12.5 更多信息  174
第13章 MPI和异构计算  175
13.1 现代集群中的MPI  175
13.2 MPI任务地点  176
13.3 DAPL提供者的选择  180
13.3.1 第一个提供者OFA-V2-MLX4_0-1U  180
13.3.2 第二个提供者ofa-v2-scif0以及对节点内部结构的影响  180
13.3.3 最后一个提供者  181
13.3.4 混合程序的可扩展性  182
13.3.5 负载均衡  184
13.3.6 任务和线程映射  184
13.4 总结  185
13.5 致谢  185
13.6 更多信息  185
第14章 Intel Xeon Phi协处理器功耗分析  186
14.1 功耗分析  186
14.2 用软件测量功耗和温度  187
14.2.1 创建功耗和温度监控脚本  188
14.2.2 使用micsmc工具创建功耗和温度记录器  189
14.2.3 使用IPMI进行功耗分析  190
14.3 基于硬件的功耗分析方法  192
14.4 总结  196
14.5 更多信息  196
第15章 集成Intel Xeon Phi协处理器至集群环境  197
15.1 早期探索  197
15.2 Beacon系统的历史  197
15.3 Beacon系统的架构  198
15.3.1 硬件环境  198
15.3.2 软件环境  198
15.4 Intel MPSS安装步骤  199
15.4.1 系统准备  199
15.4.2 安装Intel MPSS栈  200
15.4.3 生成和定制配置文件  201
15.4.4 MPSS升级  204
15.5 建立资源和工作负载管理器  204
15.5.1 TORQUE  204
15.5.2 序言程序  205
15.5.3 尾声程序  206
15.5.4 TORQUE/协处理器集成  207
15.5.5 Moab  207
15.5.6 提高网络局部性  207
15.5.7 Moab/协处理器集成  207
15.6 健康检查和监控  208
15.7 常用命令脚本化  209
15.8 用户软件环境  210
15.9 今后的方向  211
15.10 总结  212
15.11 致谢  212
15.12 更多信息  212
第16章 在Intel Xeon Phi协处理器上支持集群文件系统  214
16.1 网络配置概念和目标  214
16.1.1 网络选项概览  215
16.1.2 设置集群启用协处理器的步骤  216
16.2 协处理器文件系统支持  217
16.2.1 支持NFS  217
16.2.2 支持Lustre文件系统  218
16.2.3 支持Fraunhofer BeeGFS文件系统  219
16.2.4 支持Panasas PanFS文件系统  220
16.2.5 集群文件系统的选择  220
16.3 总结  220
16.4 更多信息  221
第17章 NWChem:大规模量子化学仿真  222
17.1 引言  222
17.2 回顾单线程CC形式  222
17.3 NWChem软件架构  225
17.3.1 全局数组  225
17.3.2 张量收缩引擎  226
17.4 设计卸载解决方案  226
17.5 卸载架构  229
17.6 内核优化  230
17.7 性能评估  232
17.8 总结  233
17.9 致谢  235
17.10 更多信息  235
第18章 大规模多系统上的高效嵌套并行  238
18.1 动机  238
18.2 基准测试  238
18.3 基线基准测试  239
18.4 流水线方法——Flat_arena类  240
18.5 Intel TBB用户管理任务调度平台  241
18.6 分层方法——Hierarchical_arena类  243
18.7 性能评估  243
18.8 对NUMA架构的影响  245
18.9 总结  246
18.10 更多信息  246


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

网管员必读——故障排除

本书是《网管员世界》杂志社推出的一本集知识性和实用性于一身的网络管理技术书籍,书中收集了《网管员世界》自创刊以来“故障诊断”栏目中...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊