书籍详情

高性能集群计算(第一卷 结构与系统)

高性能集群计算(第一卷 结构与系统)

作者:(美)Rajkumar Buyya 编;郑纬民 等译

出版社:电子工业出版社

出版时间:2001-01-01

ISBN:9787505367708

定价:¥73.00

购买这本书可以去
内容简介
  本书全面系统地介绍了高性能集群计算技术的概念、理论研究和工程实践成果。主要论述了集群计算的需求和一般问题,网络、协议与I/O技术,进程调度、负载共享与平衡技术和有代表性的集群计算机系统等。本书内容丰富全面,既介绍了当今科学家在集群计算领域的最新成果,也介绍了集群计算在科学与工程计算及信息服务领域应用的大量实践经验。本书既可以作为高等院校计算机专业高年级学生和研究生的教科书或参考书,也可以供利用并行计算机从事科学与工程计算和信息服务等科技人员学习参考。
作者简介
暂缺《高性能集群计算(第一卷 结构与系统)》作者简介
目录
第一部分 需求和普遍问题
第1章 集群计算概述
1.1 介绍
1.2 可扩展并行计算机体系结构
1.3 向低价并行计算前进的动机
1.4 机会的曙光
1.5 集群计算机及其体系结构
1.6 集群分类
1.7 集群的商品化部件
1.8 网络服务/通信软件
1.9 集群中间件和单一系统映像(SSI)
1.10 资源管理和调度(RMS)
1.11 编程环境和工具
1.12 集群应用程序
1.13 典型集群系统
1.14 SMP集群(CLUMPS)
1.15 总结
1.16 参考文献
第2章 集群设置和管理
2.1 介绍
2.2 设置集群
2.3 安全性
2.4 系统监控
2.5 系统调整
2.6 参考文献
第3章 构建可扩展的服务
3.1 介绍
3.2 环境
3.3 资源共享
3.4 资源共享的增强局部性
3.5 原型实现和扩展
3.6 结论和未来的研究
3.7 参考文献
第4章 可靠的集群计算
4.1 介绍
4.2 两个领域会聚
4.3 可靠性概念
4.4 集群的系统结构
4.5 检测和掩盖错误
4.6 从错误中恢复
4.7 可靠集群计算的实践
4.8 参考文献
第5章 开发高吞吐量的集群系统
5.1 介绍
5.2 Condor概述
5.3 软件开发
5.4 系统管理
5.5 总结
5.6 参考文献
第6章 性能模型与模拟
6.1 介绍
6.2 新的性能问题
6.3 有效并行计算的费用模型
6.4 结论
6.5 参考文献
第7章 元计算:利用非正式的超级计算机
7.1 概述
7.2 元计算的演变
7.3 元计算机的设计目标和问题
7.4 元计算项目
7.5 正在兴起的元计算系统
7.6 总结和结论
7.7 参考文献
第8章 在元计算系统中指定资源和服务
8.1 对资源描述工具的需求
8.2 指定硬件和软件资源的策略
8.3 资源和服务描述(RSD)
8.4 小结
8.5 参考文献
第二部分 网络、协议和I/O
第9章 高速网络
9.1 概述
9.2 设计问题
9.3 快速以太网
9.4 高性能并行接口(HiPPI)
9.5 异步传输模式(ATM)
9.6 可扩展并发接口(SCI)
9.7 ServerNet
9.8 Myrinet
9.9 内存通道
9.10 Synfinity
9.11 参考文献
第10章 轻量级消息传递系统
10.1 概述
10.2 通信性能的延迟/带宽评估
10.3 集群的传统通信机制
10.4 轻量级通信机制
10.5 内核级的轻量级通信
10.6 用户级的轻量级通信
10.7 消息传递系统之间的比较
10.8 参考文献
第11章 活动消息
11.1 概述
11.2 要求
11.3 州编程模型
11.4 AM的实现
11.5 分析
11.6 AM上的编程模型
11.7 未来的工作
11.8 参考文献
第12章 Xpress传输协议
12.1 网络为集群计算提供的服务
12.2 一种新方法
12.3 XTP的功能
12.4 性能
12.5 应用
12.6 XTP在集群计算中的未来
12.7 参考文献
第13章 ATM集群中的拥塞管理
13.1 ATM网络概述
13.2 现有的方法
13.3 ATM在LAN上的模拟
13.4 移植计划
13.5 结论
13.6 参考文献
第14章 网络负载平衡
14.1 介绍
14.2 方法
14.3 常见错误
14.4 产品
14.5 总结
14.6 参考文献
第15章 多通路通信
15.1 介绍
15.2 网络及应用中的异构
15.3 多通路通信
15.4 实例研究
15.5 总结
15.6 参考文献
第16章 网络存储器
16.1 介绍
16.2 远程存储器调页
16.3 网络存储器文件系统
16.4 网络存储器在数据库方面的应用
16.5 总结
16.6 参考文献
第17章 分布式共享存储器
17.1 介绍
17.2 数据一致性
17.3 网络性能问题
17.4 其他设计问题
17.5 结论
17.6 参考文献
第18章 集群并行I/O:实现方法与现有系统
18.1 引言
18.2 集群I/O系统的分类
18.3 并行I/O问题
18.4 文件抽象
18.5 方法和技术
18.6 系统结构与一些现有系统
18.7 ViPIOS方法
18.8 结论及发展趋势
18.9 参考文献
第19章 软件RAID和并行文件系统
19.1 引言
19.2 数据的物理存放
19.3 缓存
19.4 预取
19.5 接口
19.6 参考文献
第三部分 进程调度、负载共享与负载平衡
第20章 作业与资源管理系统
20.1 成因与历史演变
20.2 作业和资源管理系统的组成与结构
20.3 RMS的当前技术发展情况
20.4 现在和将来所面临的挑战
20.5 小结
20.6 参考文献
第21章 集群上并行作业的调度
21.1 引言
21.2 背景
21.3 附性作业的进程迁移
21.4 可延展性作业的动态并行性
21.5 基于通信的协同调度
21.6 批调度
21.7 小结
21.8 参考文献
第22章 负载共享与容错管理器
22.1 引言
22.2 集群计算中的负载共享
22.3 利用检查点进行容错
22.4 负载共享与容错的集成
22.5 相关工作
22.6 结论
22.7 参考文献
第23章 并行程序调度技术
23.1 引言
23.2 网络计算环境下的调度问题
23.3 调度任务到通过快速网络连接的机器上
23.4 调度任务到任意的处理机网络
23.5 CASCH:一个并行化和调度工具
23.6 小结与结束语
23.7 参考文献
第24章 可配置的动态负载平衡
24.1 引言
24.2 动态负载平衡(DLB)
24.3 DLB模型和负载平衡策略的选择决定过程
24.4 编译器和运行时系统
24.5 实验结果
24.6 小结
24.7 参考文献
第25章 异构系统上的映射与调度
25.1 引言
25.2 映射与调度
25.3 任务粒度与划分的问题
25.4 静态调度和动态调度
25.5 负载平衡问题
25.6 小结
25.7 参考文献
第四部分 典型的集群系统
第26章 Beowulf
26.1 Beowulf探源
26.2 系统体系结构的进化过程
26.3 软件开发
26.4 下一代Beowulf计算
26.5 21世纪的Beowulf
26.6 参考文献
第27章 RWC PC集群Ⅱ以及SCore集群系统软件
27.1 简介
27.2 使用通用商品硬件构建结构紧凑的PC集群
27.3 基于Unix的SCore并行操作系统环境
27.4 性能评价
27.5 结论
27.6 参考文献
第28章 COMPaS:一个基于Pentium Pro PC的SMP集群
28.1 COMPaS:一个基于Pentium Pro PC的SMP集群
28.2 使用PC构建集群
28.3 SMP集群的编程
28.4 实例分析--COMPaS系统的评测结果
28.5 PC SMP集群编程指南
28.6 小结
28.7 参考文献
第29章 NanOS集群操作系统
29.1 简介
29.2 系统结构
29.3 Nan0S
29.4 MCMM
29.5 HIDRA
29.6 小结
29.7 参考文献
第30章 基于BSP的可适应并行处理
30.1 简介
30.2 Bulk同步并行模型
30.3 非专用集群上的并行计算
30.4 Bulk同步并行模型中的可适应并行性
30.5 可适应Bulk同步并行性的编程环境
30.6 A-BSP在并行计算中的应用
30.7 A-BSP在非专用工作站集群的应用
30.8 结论
30.9 参考文献
第31章 MARS:一个可适应并行编程环境
31.1 动机与目标
31.2 相关工作
31.3 NOW可达到的能力
31.4 MARS方案
31.5 实验结果
31.6 结论和进一步工作
31.7 参考文献
第32章 自适应并行计算的Gardens方法
32.1 引言
32.2 相关工作
32.3 通信
32.4 自适应性和任务分派
32.5 性能结果
32.6 小结
32.7 参考文献
第33章 ParPar系统:一种软件MPP
33.1 引言
33.2 ParPar系统
33.3 系统配置和控制
33.4 作业控制
33.5 调度
33.6 并行I/O
33.7 项目状况
33.8 参考文献
第34章 Pitt并行计算机
34.1 引言
34.2 操作系统
34.3 拉普拉斯问题
34.4 拉普拉斯程序的技术描述
34.5 拉普拉斯操作系统的用户描述
34.6 线性联立方程组
34.7 一个应用程序实例
34.8 小结
34.9 参考文献
第35章 RS/6000 SP系统:可扩展并行集群系统
35.1 双重特性
35.2 SP系统的体系结构
35.3 SP系统结构
35.4 结束语
35.5 参考文献
第36章 可扩展和高可用的集群Web服务器
36.1 引言
36.2 Web服务器和动态内容
36.3 细粒度负载平衡
36.4 共享文件系统和可扩展I/O
36.5 Web上的可扩展数据库访问
36.6 高可用性
36.7 结论
36.8 参考文献
猜您喜欢

读书导航