书籍详情

流体系结构的编译技术:面向科学计算程序的编译优化

流体系结构的编译技术:面向科学计算程序的编译优化

作者:杜静

出版社:国防科技大学出版社

出版时间:2014-10-01

ISBN:9787567302167

定价:¥28.00

购买这本书可以去
内容简介
  《流体系结构的编译技术:面向科学计算程序的编译优化》全面系统地论述了流体系结构上面向科学计算的编译优化技术,包括理论分析、优化设计和实验评测等关键内容。为了便于研究的开展和成果的验证,《流体系结构的编译技术:面向科学计算程序的编译优化》针对面向科学计算的流编译器——SF95Compiler的编译优化技术进行深入研究,重点研究了其编译框架中的流变换、代码优化和科学计算函数库三个关键部分,提出了多种增强并行、提高重用、隐藏延迟的流编译优化技术。并以典型流体系结构——Imagine为平台,在SF95compiler流编译器中实现和验证了《流体系结构的编译技术:面向科学计算程序的编译优化》提出的优化技术。《流体系结构的编译技术:面向科学计算程序的编译优化》条理清晰、内容新颖、分析严谨、系统性强、理论联系实际、强调优化技术的工程实现,具有较强的实际应用背景。以流处理器为代表的新型体系结构是高性能计算机发展的必然趋势,而基于新型体系结构的应用开发是目前许多学科领域的科技工作者都应熟练掌握的一门技术。《流体系结构的编译技术:面向科学计算程序的编译优化》涉及到流体系结构、流编程模型、流编译系统和传统编译优化技术等内容,主要面向从事高性能计算尤其是使用新型体系结构加速专业领域计算的科研人员和工程师,也可作为高等院校计算机体系结构、高性能编译、计算机应用等专业的教师和研究生进行有关课题研究或课程学习时的参考书。《流体系结构的编译技术:面向科学计算程序的编译优化》所附的算法代码也能够为基于新型体系结构的应用开发人员和优化设计人员提供有益的学习参考。
作者简介
暂缺《流体系结构的编译技术:面向科学计算程序的编译优化》作者简介
目录
第一章 绪论
1.1 基于流体系结构加速科学计算程序
1.1.1 高性能体系结构面临的问题
1.1.2 流体系结构和流编程模型的性能优势
1.1.3 科学计算程序对高性能的需求
1.1.4 基于流体系结构和流编程模型加速科学计算程序
1.2 流体系结构和流编译技术
1.2.1 流体系结构
1.2.2 流编程模型和编译系统
1.2.3 传统编译优化技术
1.3 面向科学计算的流编译技术
1.3.1 研究重点
1.3.2 研究难点
1.3.3 研究内容
1.4 本书结构
第二章 Imagine上面向科学计算的编译框架
2.1 Imagine流处理系统
2.1.1 Imagine流体系结构
2.1.2 Imagine流编程模型
2.1.3 Imagine流编译系统
2.1.4 Imagine的性能潜力
2.2 面向科学计算的SF95流编程和编译技术
2.2.1 科学计算程序对流编程和编译的挑战
2.2.2 SF、95流编程语言
2.2.3 SF95Compiler流编译器
2.3 小结
第三章 基于D&c矩阵的优化流变换技术
3.1 问题的提出
3.2 相关工作
3.3 D&C矩阵
3.4 基于D&C矩阵的优化流变换
3.4.1 粗粒度程序变换
3.4.2 细粒度程序变换
3.4.3 数据流组织优化
3.5 编译实现
3.6 实验评测
3.6.1 粗粒度程序变换评测
3.6.2 细粒度程序变换评测
3.6.3 数据流组织优化评测
3.7 小结
第四章 基于参数模型的长流分段技术
4.1 问题的提出
4.2 相关工作
4.3 基本框架
4.3.1 程序参数化
4.3.2 程序运行时间建模
4.3.3 求解最优分段
4.4 基于参数模型的长流分段
4.4.1 建立参数模型
4.4.2 计算密集型程序的分段
4.4.3 访存密集型程序的分段
4.4.4 任意程序的分段
4.5 编译实现
4.5.1 算法实现
4.5.2 优化策略的选择
4.6 实验评测
4.7 小结
第五章 开发计算核心内的计算与访存重叠
5.1 问题的提出
5.2 相关工作
5.3 经验策略
5.3.1 程序建模
5.3.2 策略实现
5.4 长流策略
5.4.1 程序建模
5.4.2 策略实现
5.5 最优策略
5.5.1 研究思路
5.5.2 分段决策
5.5.3 策略实现
5.6 实验评测
5.6.1 小规模程序
5.6.2 大规模程序
5.7 小结
第六章 开发计算核心间的数据流重用
6.1 问题的提出
6.2 相关工作
6.2.1 存储重用
6.2.2 重用优化
6.3 开发核间的长流重用
6.3.1 重用指导的kemel重排序
6.3.2 重用优化的kemel集合
6.3.3 重用驱动的长流分段
6.4 开发核间的部分重用
6.4.1 重要概念
6.4.2 基本思想
6.4.3 识别kernel间部分重用
6.4.4 开发kernel间部分重用
6.5 编译实现
6.6 实验评测
6.7 小结
第七章 典型科学计算库函数的优化与实现
7.1 问题的提出
7.2 相关工作
7.3 Jacobi
7.3.1 流化方法
7.3.2 实验评测
7.4 GEMM
7.4.1 流化方法
7.4.2 实验评测
7.5 Transo
7.5.1 流化方法
7.5.2 实验评测
7.6 Laplace
7.6.1 流化方法
7.6.2 实验评测
7.7 Swim
7.7.1 流化方法
7.7.2 实验评测
7.8 小结
参考文献
猜您喜欢

读书导航