书籍详情

数据仓库生命周期工具箱:设计、开发和部署数据仓库的专家方法

数据仓库生命周期工具箱:设计、开发和部署数据仓库的专家方法

作者:(美)Ralph Kimball[等]著;肖明[等]译;肖明译

出版社:电子工业出版社

出版时间:2004-01-01

ISBN:9787505391925

定价:¥86.00

购买这本书可以去
内容简介
  《数据仓库生命周期工具箱》刚一问世,好评如潮。在Barnesandnoble.com公司网站上,有读者评价说:“尽管我在项目管理和数据建模方面积累了多年的初中经验,但我认为本书才是解决有关项目管理和数据仓库生命周期方面问题的最好参考信息源。”还有读者认为“本书要比第一版更加物有所值,它探讨了有关数据仓库的设计、实现、运行、维护和管理等方面的几乎所有问题。”本书深入探讨了两个主题,一个是业务维生命周期方法。另一个是数据仓库总线结构。本书的主要读者对象应该是那些从事数据仓库的创建和管理工作的设计人员或者管理人员。本书略微偏向技术。RalphKimball,不仅是自1982年以来数据仓库界最伟大的幻想家,而且是目前在数据仓库方面国际知名度最高的演讲家,项目顾问以及教师之一。他曾经为《智能化企业》杂志负责撰写“数据仓库结构”专栏。KalphKimball博士的几位合作者们也都各自创建了获得了极大成功的数据仓库咨询公司,包括:LauraReeves的StarSoft解决方案公司、MargyRoss的DecisionWorks咨?疽约癢arrenThornthwaite的InfoDynamicsLLC公司。本书是著名数据仓库畅销书作者RalphKimball的著名作品,在世界各地畅销不衰。这是目前惟一一本从技术和管理两个角度介绍了使数据仓库项目获得成功所必备的各种知识和经验教训的专著,这些内容都是作者自1982年以来在从事数以百计的数据仓库安装和咨询任务过程中不断积累总结出来的。书末的两个附录中提供了大量的框架、任务、模板以及生动详实的样例(具体内容见本书配套光盘),所有这些都使本书别具一格。全书主题广泛,思想深刻,内容详尽,图文并茂。本书不仅是现代信息系统开发人员的重要指南,而且是所有面向数据仓库项目的设计、开发、管理和咨询人员的高级参谋,并且适合信息管理与信息系统、计算机应用、电子商务等专业的高校师生作为教学参考用书,还可供从事传统数据库系统工作的技术人员参考阅读。
作者简介
  Ralph Kimball,不仅是自1982年以来数据仓库界最伟大的幻想家,而且是目前在数据仓库方面国际知名度最高的演讲家,项目顾问以及教师之一。他曾经为《智能化企业》杂志负责撰写“数据仓库结构”专栏。 Kalph Kimball博士的几位合作者们也都各自创建了获得了极大成功的数据仓库咨询公司,包括:Laura Reeves 的StarSoft解决方案公司、Margy Ross的DecisionWorks咨询公司以及Warren Thornthwaite的InfoDynamicsLLC公司。
目录
第1章  数据仓库的基本组成1
  1.1  数据仓库的基本组成要素1
  1.2  数据仓库基本过程10
  1.3  有关数据仓库的大讨论
    1.3.1  数据仓库建模
    1.3.2  数据集市与数据仓库
    1.3.3  分布式与集中式数据仓库
  小结
第一部分  项目管理与需求
第2章  业务维生命周期
  2.1  生命周期演化
  2.2  生命周期方法
    2.2.1  项目规划
    2.2.2  业务需求定义
    2.2.3  数据轨迹:维度建模
    2.2.4  数据轨迹:物理设计
    2.2.5  数据轨迹:数据登台设计与开发
    2.2.6  技术轨迹:技术结构设计
    2.2.7  技术轨迹:产品选择与安装
    2.2.8  应用轨迹:最终用户应用规范
    2.2.9  应用轨迹:最终用户应用开发
    2.2.10  部署
    2.2.11  维护与增长
    2.2.12  项目管理
  2.3  业务维生命周期使用指南
  2.4  业务维生命周期指示标记与浏览帮助
  小结
第3章  项目规划与管理
  3.1  项目定义
    3.1.1  建设数据仓库应做的准备工作
    3.1.2  “最后检验”准备是否就绪
    3.1.3  评价影响准备就绪的因素
    3.1.4  分析准备状态是否不足的方法
    3.1.5  确定初步范围
    3.1.6  构造业务的合理性证明
  3.2  项目规划
    3.2.1  建立项目标识
    3.2.2  组建项目组
    3.2.3  制定项目计划
  3.3  项目管理
    3.3.1  举行项目小组启动会议
    3.3.2  监控项目状态
    3.3.3  维护项目计划和项目文档
    3.3.4  管理项目范围
    3.3.5  制定有关管理期望的交流计划
  小结
第4章  收集项目需求
  4.1  定义项目需求的各种方法
  4.2  访谈准备
  4.3  准备合适的访谈者
  4.4  进行访谈
  4.5  开始访谈
  4.6  结束访谈
  4.7  对访谈结果进行审查
  4.8  准备和发布项目需求规范文档
  4.9  项目需求收集完成后的工作
  小结
第二部分  数据设计
第5章  维度建模的第1课
  5.1  维度建模案例
    5.1.1  什么是实体-关系建模
    5.1.2  什么是维度建模
    5.1.3  维度建模与实体-关系建模之间的关系
    5.1.4  维度建模的优点
  5.2  利用数据仓库总线结构将各种维度模型组合起来
    5.2.1  规划危机
    5.2.2  带总线结构的数据集市
    5.2.3  一致性维度和标准事实的定义
    5.2.4  一致性维度的设计
    5.2.5  确保采用一致性维度
    5.2.6  建立一致性事实定义
    5.2.7  数据集市粒度的重要性
    5.2.8  多元数据集市
    5.2.9  拯救不兼容性数据集市
    5.2.10  何时不需要一致性维度
    5.2.11  数据仓库总线
  5.3  基本维度建模技术
    5.3.1  事实表与维度表
    5.3.2  向上和向下探查维度表内情
    5.3.3  建议使用的时间维度
    5.3.4  加法性事实. 半加法性事实以及非加法性事实
    5.3.5  设计单个事实表的4步设计方法
  小结
第6章  维度建模的研究生课程
  6.1  扩充维度表的设计
    6.1.1  多对多维度
    6.1.2  多对一与一对多陷阱
    6.1.3  维度的不同角色扮演
    6.1.4  组织与其下级部门的层次表示
    6.1.5  不可预知的层次深度
    6.1.6  大型维度中的时间戳变化
    6.1.7  创建审计维度
    6.1.8  维度数是太少了还是太多了
  6.2  扩充事实表的设计
    6.2.1  具有不同粒度的事实及其分配
    6.2.2  以天为单位的维度表
    6.2.3  多种指标单位
    6.2.4  跨国货币情况跟踪
    6.2.5  数值分组报告
  6.3  高级ROLAP查询和报告
    6.3.1  采用多种技术探查的查询
    6.3.3  市场份额分析
  小结
第7章  多维模型的创建
  7.1  开始阶段使用的矩阵方法
    7.1.1  矩阵的创建
    7.1.2  必要的准备
    7.1.3  列出数据集市
    7.1.4  列出各种维度
    7.1.5  标记交叉点
  7.2  用4步法设计各个事实表
  7.3  管理维度建模项目
    7.3.1  数据仓库总线结构矩阵
    7.3.2  事实表图表
    7.3.3  事实表明细图
    7.3.4  维度表明细图
    7.3.5  维度建模小组的创建步骤
    7.3.6  创建初始草图
    7.3.7  跟踪基本事实和派生事实
    7.3.8  让信息系统小组进行输入
    7.3.9  与核心业务用户一起工作
    7.3.10  向业务用户进行介绍
  7.4  管理建模过程中存在的问题
    7.4.1  为每个事实表和维度表确定来源
    7.4.2  候选数据源
    7.4.3  源数据所有权
    7.4.4  数据提供者
    7.4.5  选择数据源的详细准则
    7.4.6  客户匹配与内部成员匹配
    7.4.7  浏览数据内容
    7.4.8  将源数据映射到目标数据
    7.4.9  什么时候才算完成
    7.4.10  为未来做准备
    7.4.11  使用数据建模工具
    7.4.12  估计行数
    7.4.13  聚集设计
    7.4.14  确定聚集的内容
  小结
第三部分  数据仓库结构
第8章  数据仓库结构介绍
  8.1  结构的价值
  8.2  一个结构框架和方法
    8.2.1  定义列
    8.2.2  定义细节级别(行)
    8.2.3  逻辑模型与物理模型
    8.2.4  框架小结
  8.3  技术结构概述
    8.3.1  服务和数据存储
    8.3.2  从源系统到用户桌面的流程
    8.3.3  主要技术结构特性
    8.3.4  数据仓库结构评估
  小结
第9章  后台技术结构
  9.1  后台数据存储
    9.1.1  源系统
    9.1.2  数据登台区
    9.1.3  呈现服务器
  9.2  后台服务
    9.2.1  普通数据登台要求
    9.2.2  创建与购买
    9.2.3  提取服务
    9.2.4  数据转换服务
    9.2.5  数据装载服务
    9.2.6  数据登台作业控制服务
  9.3  后台资产管理
    9.3.1  备份与恢复
    9.3.2  存档与检索
    9.3.3  备份与存档规划
    9.3.4  提取和装载安全性问题
    9.3.5  未来登台服务
  小结
第10章  前台结构
  10.1  前台数据存储
    10.1.1  存取工具数据存储
    10.1.2  标准报告数据存储
    10.1.3  下行系统
  10.2  用于数据存取的前台服务
    10.2.1  数据仓库浏览
    10.2.2  存取与安全性服务
    10.2.3  活动监控服务
    10.2.4  查询管理服务
    10.2.5  查询服务位置
    10.2.6  标准报告服务
    10.2.7  未来存取服务
    10.2.8  桌面服务
    10.2.9  建模应用和数据挖掘
    10.2.10  数据存取的Web含义
    10.2.11  桌面工具结构方法
  小结
第11章  体系结构与元数据
  11.1  体系结构
    11.1.1  体系结构的驱动力
    11.1.2  体系结构的演变
    11.1.3  后台体系结构因素
    11.1.4  前台体系结构因素
    11.1.5  连通性与联网因素
    11.1.6  体系结构小结
  11.2  元数据与元数据目录
    11.2.1  什么是元数据
    11.2.2  源系统元数据
    11.2.3  数据登台元数据
    11.2.4  数据库管理系统元数据
    11.2.5  前台元数据
    11.2.6  活动元数据样例
    11.2.7  元数据目录的维护
    11.2.8  元数据小结
  小结
第12章  有关互联网和安全性方面的研究生课程
  12.1  组件软件结构
    12.1.1  互联网对结构的影响
  12.2  安全性的脆弱
    12.2.1  物理资产409
    12.2.2  信息资产:数据. 财务资产以及声誉
    12.2.3  软件资产
    12.2.4  执行业务任务的能力
    12.2.5  网络威胁
  12.3  安全性:解决方案
    12.3.1  路由器与防火墙
    12.3.2  目录服务器
    12.3.3  加密技术
  12.4  数据仓库环境下的安全性管理
  12.5  在安全性方面应采取的措施
    12.5.1  立即执行的战术性措施
    12.5.2  战略性措施
  小结
第13章  创建结构计划与产品选择
  13.1  创建结构
    13.1.1  结构创建过程
    13.1.2  创建技术结构计划
  13.2  选择产品
    13.2.1  集中关注业务需求
    13.2.2  主要数据仓库评估区域
    13.2.3  评估过程
    13.2.4  创建产品评估矩阵
    13.2.5  进行市场研究
    13.2.6  将选择缩减到一份简短清单上
    13.2.7  评估选项
    13.2.8  选择开发一个原型
    13.2.9  产品推荐
    13.2.10  评估捷径
    13.2.11  后台评估
    13.2.12  前台评估
  13.3  安装
  小结
第四部分  数据仓库实施
第14章  有关聚集的研究生课程
  14.1  聚集的目标和风险
  14.2  确定要聚集的内容
  14.3  制定聚集表计划
  14.4  对聚集进行处理
  14.5  对聚集进行管理
  14.6  聚集浏览系统的设计目标
  14.7  聚集浏览算法
    14.7.1  与规划数据相交
    14.7.2  有关MIN, MAX, COUNT, AVG的处理
    14.7.3  适用于所有人的聚集
  小结
第15章  完成物理设计
  15.1  制定标准
    15.1.1  数据库对象命名标准
    15.1.2  为用户存取的所有表使用同义词
    15.1.3  物理文件位置
  15.2  创建物理数据模型
    15.2.1  饮料商店销售额案例研究
    15.2.2  数据建模工具的使用
    15.2.3  物理数据结构的设计
    15.2.4  估计最初的开发规模
  15.3  制定最初的索引计划
    15.3.1  索引和查询策略概述
    15.3.2  为事实表创建索引
    15.3.3  为维度表创建索引
    15.3.4  为装载创建索引
    15.3.5  在装载完成后对表和索引进行分析
    15.3.6  索引案例研究
  15.4  设计和创建数据库实例
    15.4.1  内存
    15.4.2  块大小
    15.4.3  磁盘存取样例
    15.4.4  保存数据库创建脚本和参数文件
  15.5  创建物理存储结构
    15.5.1  计算表和索引的大小
    15.5.2  制定分割计划
    15.5.3  建立RAID
  15.6  实施使用监控系统
    15.6.1  性能
    15.6.2  用户支持
    15.6.3  市场营销
    15.6.4  规划
    15.6.5  工具
  小结
第16章  数据登台
  16.1  数据登台概述
  16.2  做一些预备工作
    16.2.1  良好系统开发实践的重要性
  16.3  进行有效的计划
    16.3.1  步骤1:高级计划
    16.3.2  步骤2:数据登台工具
    16.3.3  步骤3:详细计划
  16.4  维度表登台
    16.4.1  步骤4:装载一个简单的维度表
    16.4.2  静态维度表的转换
    16.4.3  步骤5:实施维度变化逻辑
    16.4.4  步骤6:装载剩余维度表
  16.5  事实表装载与数据仓库操作
    16.5.1  步骤7:装载原子级历史事实
    16.5.2  步骤8:增量式事实表登台
    16.5.3  步骤9:聚集表和多维联机分析处理装载
    16.5.4  步骤10:数据仓库的操作与自动化
  16.6  数据质量与净化
    16.6.1  数据质量改进
    16.6.2  数据质量保证
  16.7  其他问题
    16.7.1  数据登台区中的存档问题
    16.7.2  源系统中的回退段问题
    16.7.3  磁盘空间管理问题
  小结
第17章  创建最终用户应用
  17.1  最终用户应用角色
    17.1.1  最终用户应用模板
    17.1.2  生命周期的时间选择
  17.2  应用规范
    17.2.1  确定最初的模板集合
    17.2.2  设计模板浏览方法
    17.2.3  确定模板标准
    17.2.4  详细模板规范
    17.2.5  用户审查
  17.3  最终用户应用开发
    17.3.1  选择一种实现方法
    17.3.2  应用开发
    17.3.3  测试与数据验证
    17.3.4  文档及其展示
    17.3.5  像软件开发管理人员那样思考问题
    17.3.6  应用模板维护
  小结
第五部分  数据仓库的部署与增长
第18章  规划部署
  18.1  确定是否已经准备好桌面安装
  18.2  制定最终用户培训策略
    18.2.1  集成和裁剪培训内容
    18.2.2  开展最终用户培训
    18.2.3  实施最终用户培训
  18.3  制定最终用户支持策略
    18.3.1  确定对组织结构的支持
    18.3.2  参与数据协调方面的支持
    18.3.3  参与最终用户应用支持
    18.3.4  建立交流与反馈支持
    18.3.5  提供支持文档
  18.4  研制部署发布框架
    18.4.1  Alpha版本发布
    18.4.2  Beta版本发布
    18.4.3  产品发布(又名部署)
  18.5  编制有关部署策略的文档
  小结
第19章  数据仓库的维护与增长
  19.1  对现有数据仓库环境的管理
    19.1.1  关注业务用户
    19.1.2  管理数据仓库操作
    19.1.3  数据仓库的成功测度和市场营销
    19.1.4  经常进行交流
  19.2  为数据仓库的增长与演变做准备
    19.2.1  建立数据仓库指导委员会
    19.2.2  优化数据仓库增长与演变的机会
    19.2.3  采用生命周期方法来管理数据仓库的迭代增长与演变
  小结
附录A  生命周期项目计划
附录B  关于本书附带的CD-ROM
  B.1  项目计划
  B.2  数据仓库总线结构样例
  B.3  模板、检查清单、图形和帮助
    第2章  业务维生命周期
    第3章  项目规划与管理
    第4章  项目需求的收集
    第7章  多维模型的创建
    第8章  数据仓库结构介绍
    第9章  后台技术结构
    第10章  前台结构
    第11章  体系结构与元数据
    第12章  有关互联网和安全性的研究生课程
    第13章  结构计划的创建与产品的选择
    第15章  完成物理设计
    第16章  数据登台
    第17章  创建最终用户应用
    第18章  规划部署
  B.4  CD-ROM的使用
  B.5  CD-ROM浏览器的用法说明
  B.6  软件要求
猜您喜欢

读书导航