|
|
51CTO旗下网站
|
|
移动端

3.9 详情分析

《高性能并行珠玑:多核和众核编程方法》第3章HBM上的SIMD与并发优化,本书中展示了如何在处理器和协处理器上进行并行处理和编程——展示了更好利用Intel Xeon Phi协处理器和Intel Xeon 处理器或其他多核处理器的系统计算潜力的最有效的方法。本节为大家介绍详情分析。

作者:张云泉 等译来源:机械工业出版社|2017-11-14 18:30

【51CTO技术沙龙】10月27日,让我们共同探索AI场景化应用实现之道

3.9 详情分析

我们使用Intel VTune Amplif?ier XE 2013工具对结果进行了分析。虽然我们在优化过程中使用了许多性能度量方法,但我们在图3-22中只列出最相关的部分。

VPU_INSTRUCTIONS_EXECUTED参数负责统计所有向量指令,且VPU_ELEMENTS_ACTIVE参数负责统计针对向量操作(内存和算法)的所有VPU可用有效通道。

对于所使用的配置文件,Intel VTune Amplif?ier工具的硬件事件采样收集器能够通过配置文件概述使用性能监控单元(PMU)计数器溢出功能的应用程序。使用上述测量值的用例数据大约有1000万条。而且采样不能保证数据的100%准确。基于事件采样的平均开销大约是每1毫秒的2%采样间隔。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

SUN Solaris 9/10系统管理员认证指南

本书专门根据SUN官方的SCSA for Solaris 9&10考试大纲撰写而成,全面覆盖了SCSA for Solaris 9/10的认证考点,除此之外本书还有大量的非考...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊