书籍详情
SQL Server Integration Services 2005标准指南(中文版)
作者:(美)哈瑟登;马树奇、等 译
出版社:电子工业出版社
出版时间:2008-01-01
ISBN:9787121052590
定价:¥79.00
购买这本书可以去
内容简介
Integration Services是SQL Server 2005的重要开发工具,是DTS(数据转换服务)的后续与革新。SOL Server 2005提供了最新的大型数据库管理系统。在多年来建立起各种数据库之后,几乎所有的应用单位都面临着如何将数据库中的数据根据企业应用的需要提取出来、转换成需要的形式和载入相关文件或者应用程序的问题,这就是所谓的ETL。Integration Services是SQL Server 2005提供的最新的ETL处理工具,它以Visual Studio为基础,提供了大量现成的组件,可供人们快速建立起运行稳定、性能出色的ETL程序。 本书适合具有一定SQL Server 2005应用经验,需要对数据库的企业应用进行二次开发的IT技术人员,以及希望了解ETL技术的有关人士使用。
作者简介
Kirk Haselden是Integration Services开发组的开发经理,在微软公司不同部门有着10年的工作经历,包括硬件部门、eHome部门,以及5年的SQL Server组Integration Services开发经验。在进入微软公司之前,Kirk曾经在多家中、小型软件公司工作,开发过用于教育、牙医等软件以及在线软件。他曾经住在堪萨斯州的Wichita,喜欢同人们一起以第三人称讨论自己的事情。
目录
第一部分 入门
第1章 欢迎使用SQL Server Integration Services
什么是SQL Server Integration Services
数据导入/导出向导
ETL工具
控制流引擎
应用程序平台
高性能的数据转换数据管线
Integration Services简史
有哪些新技术(或者说,这并不是上一代的DTS!)
本书的组织方式
项目示例
第2章 设置Integration Senrices
安装Integration Services(IS)
安装Integration Services
外围应用配置
服务和连接的外围应用配置器
功能的外围应用配置器
设置丛书示例
各项功能都在哪里
商业智能开发工作室
管理工作室
导入和导出向导
迁移向导
DTExec和DTUtil
DTExecUI
帮助资源
SQL Server 2005安装和升级论坛
联机丛书
SQLIS.COM
MSDN
SQL Server Integration Services论坛
小结
第3章 从DTS迁移
影响的范围
SSIS不是DTS
区别的范围
好消息
可用迁移资源
升级顾问
Execute DTS 2000 Package Task(执行DTS 2000包任务)
迁移向导
关于迁移工作的一些考虑
SQL Setver实例和企业管理器
Meta Data Services
迁移带密码的包
小结
第4章 建立一个包——快速入门
快速入门
情景举例
配置数据流
小结
第二部分 Integration services基础和概念
第5章 Business Intelligence Development Studio
入门
“起始页”和“社区”菜单
新建解决方案
Integration Services的选项
SSIS菜单
工具箱
设计器
Visual Studio的标准选项
解决方案资源管理器
“属性”窗口
“变量”窗口
“文件”菜单
“选项”对话框
“调试”窗口
“调用堆栈”窗口
小结
第6章 Integratioil Services的基本构件
Integration Services的基本构件
包和其他对象
任务
变量
连接管理器
日志提供程序
容器
优先约束
数据流任务、适配器和转换
数据流适配器
将数据移人或移出数据流缓冲区
数据流转换
数据流与工作流——基本区别
执行模型
连接线
功能范围
小结
第7章 用容器组合控制流
容器的概念
组织
降低复杂性
作用域划分
事务的作用域
配置的作用域
变量的作用域
执行的作用域
连接的作用域
日志记录的作用域
事件处理器的作用域
容器公共属性
“标识”
“执行”
“强制执行”
“事务”
其他类别中的属性
设计器分组——非容器
任务和Taskhost容器
属性集
持续性
包的路径和配置
调试功能
禁用控制流
自定义注册
联系信息和良好加载故障恢复
隔离
对敏感数据的保护
简单的“序列容器”
循环容器
“包”容器
包的重要属性
小结
第三部分 控制流服务
第8章 存储区任务
普通任务约定
任务用户界面
访问方法
标准选项卡
任务组
工作流任务
执行DTS 2000包任务
“发送邮件任务”
“FTP任务”
“消息队列任务”
“WMI任务”
WMI数据读取器任务
WMI事件观察器任务
Web服务任务
执行包任务
执行进程任务
执行SQL任务
脚本任务
ActiveX脚本任务
数据处理任务
大容量插入任务
XML任务
数据流任务
小结
第9章 表达式的用法
表达式基础知识
表达式函数
列
属性表达式
简单举例
数据流属性表达式
添加数据流属性表达式
变量表达式
优先约束表达式
For循环表达式
小结
第10章 存储区连接管理器
连接管理器
创建连接管理器
存储区连接管理器
ADO连接管理器
ADO.NET连接管理器
Excel连接管理器
文件连接管理器
平面文件连接管理器
连接管理器的设置:高级
FTP连接管理器
连接管理器的设置
HTTP连接管理器
MSMQ连接管理器
微软分析服务连接管理器
MultiFile连接管理器
MultiFlatFile连接管理器
ODBC连接管理器
OLEDB连接管理器
SMOServer连接管理器
SMTP连接管理器
WMI连接管理器
数据源和数据源视图
“数据源”和“数据源视图”简介
小结
第11章 日志记录和存储区日志提供程序
基础知识
快速入门
包日志记录的配置
存储区日志提供程序
Windows事件日志提供程序
文本文件日志提供程序
XML日志提供程序
SQL Server日志提供程序
SQL探查器日志提供程序
设计器日志事件查看器——“虚拟的日志提供程序”
日志记录提供程序和日志记录选项
日志提供程序
日志记录选项
日志记录架构
日志事件
自定义日志记录
使用“脚本任务”和“脚本注释”
使用“SQL任务”
小结
第12章 古老的变量
变量的重要概念——属性、作用域、类型和名称空间
变量的属性
变量的作用域
变量类型
变量的名称空间
系统变量
创建和使用变量
运行时行为
关于变量的提示和技巧
在“执行SQL任务”中使用带参数的“EvaluateAsExpression”
在子包中隐藏父包中的变量
在变量中存储对象
小结
第13章 循环和Foreach枚举器
For循环
While循环
Foreach循环
存储区Foreach枚举器
Foreach文件枚举器
Foreach Item Foreactl ADO
Foreach ADO.NET架构行集
Foreach源变量
Foreach NodeList
Foreach SMO
小结
第四部分 管理服务
第14章 解决方案的配置与部署
包的配置
包配置的工作方式
包配置组织程序
包配置类型
XML配置文件
配置编辑器
环境变量配置
注册表项配置
父包变量配置
SQL Server表配置
包配置小结
包的部署
用于部署的实用程序
配置和部署的方法
与位置相关的和驻留在计算机上的配置
移动的数据库对象
配置替换
配置连接管理器
小结
第15章 “脚本任务”的使用
脚本任务环境
“脚本任务”编辑器
“脚本任务”的使用
Dts对象
建议实践
脚本任务示例
在SSIS对象模型上工作
使用HTTP下载文件
把文本文件的内容装入一个变量
简单的自定义日志记录
异常处理
安全消息框
小结
第16章 源代码管理的使用
什么是源代码管理
源代码库
同步
签出/签入
对比
添加标签
分支
合并
BIDS设计器中的源代码管理
设置
使用源代码管理程序
实践
小结
第17章 SQL server Management Studio
SQL Server Management Studio综述
对象资源管理器
查看Windows事件日志
连接到Integration Services服务器
启动“Integration Services服务器”
连接到本地服务器
连接到远程SSIS服务器
包的管理
包的运行
已存储的包
DTS 2000包的管理
服务器缓冲存储
使用“SQL Server代理”程序执行包
配置Integration Services服务器
重新启动服务器
服务器配置
小结
第18章 包的安全保护
控制对包的访问
包存储在Integration Services服务器
存储在SQL Setver中
标识敏感数据
保护包及其他文件
包的保护级别
保护非包文件
与“SQL Server代理”集成
设置“代理”(Agent)作业来运行SSIS包
代理子系统的路径
检测对包的修改
安全场景设置
三层操作结构
小结
第五部分 数据流任务
第19章 “数据流任务”介绍
管道思想101
低附加开销转换
高性能——没有复制,不开玩笑
数据沙箱
扩展性
数据流术语
数据流属性
可使用表达式的组件属性
存储路径
缓冲区大小属性
引擎线程
RunInOptimizedMode
小结
第20章 存储区中的“数据流”组件
普通组件约定
自定义组件编辑器和高级编辑器
源适配器
DataReader源
“OLE DB源”和“OLE DB目标”适配器
“原始文件源”和“原始文件目标”适配器
“XML源”适配器
流控制转换
条件性拆分
派生列
合并
合并联接
多播
Union All
“查找”转换
“导入列”转换
“导出列”转换
审核转换
“审核”转换
“百分比抽样”和“行抽样”转换
“行计数”转换
数据管理转换
“聚合”转换
“字符映射表”转换
“复制列”转换
“数据转换”组件
“OLE DB命令”转换
“排序”转换
目标适配器
“DataReader目标”适配器
“记录集目标”适配器
“SQL Server目标”适配器
小结
第21章 使用“脚本组件”
“脚本组件”介绍
“脚本组件”具有高性能的特点
建立概念验证模块
访问不常见的或者不支持的数据源
创建源适配器
创建组件
创建目标适配器
创建组件
创建转换
创建组件
异步输出
让脚本输出成为异步输出
小结
第22章 高级数据流转换
渐变维度向导程序和转换
典型的渐变维度
其他渐变维度类型
渐变维度向导
生成的数据流
“渐变维度”组件如何处理数据行
性能方面的考虑
数据净化组件
模糊查找
“模糊分组”转换
设置“模糊分组”转换组件
文本挖掘和文档仓库组件
文本存在的问题
“字词提取”转换
字词提取转换编辑器
“字词查找”转换
小结
第23章 数据流任务内幕和调整
“数据流任务”揭秘
基本概念
布局子系统
缓存
缓存子系统
运行引擎
用于提速的总体设置
消除不必要的处理
数据流优化
插入性能
“数据流”优化方法
约束理论
资源约束的识别和优先级确定
确定如何利用约束
根据前面的决策对其他部分进行协调和同步
提升瓶颈因素的性能
如果在上述任何步骤中约束发生了改变,那么回到第一步
小结
第六部分 Integration Services编程
第24章 创建自定义任务
自定义运行时组件
创建自定义组件的要求
决定该编写什么
启动SSIS自定义组件项目
创建解决方案
添加强名称和密钥文件
引用SSIS及其他程序集
定义类
编译和安装
运行环境如何找到安装的任务
任务的开发和调试
让任务具有一个身份
添加针对具体功能的属性和函数
添加SSIS的专用属性及功能
创建任务用户界面
创建示例任务的用户界面(简单)
创建复杂的任务用户界面(复杂)
自定义任务的最佳实践
约定和约束
任务用户界面
通用原则
小结
第25章 创建自定义数据流组件
自定义组件的概念
设计时
运行时
示例组件
JPG文件EXIF读取器源适配器
数据配置转换
SQL客户和ODBC目标适配器
示例转换组件的用户界面
设计时方法
ProvideComponentProperties
ReinitializeMetaData
Validate
运行时方法
编写源适配器
设置和设计时方法
编写目标适配器
目标适配器的基本处理方式
“ReinitializeMetaData”方法
“PreExecute”方法
“ProcessInput”方法
从输入缓存获取数据
编写转换组件
小结
附录A 错误、警告和信息事件
附录B 表达式求值器参考表
第1章 欢迎使用SQL Server Integration Services
什么是SQL Server Integration Services
数据导入/导出向导
ETL工具
控制流引擎
应用程序平台
高性能的数据转换数据管线
Integration Services简史
有哪些新技术(或者说,这并不是上一代的DTS!)
本书的组织方式
项目示例
第2章 设置Integration Senrices
安装Integration Services(IS)
安装Integration Services
外围应用配置
服务和连接的外围应用配置器
功能的外围应用配置器
设置丛书示例
各项功能都在哪里
商业智能开发工作室
管理工作室
导入和导出向导
迁移向导
DTExec和DTUtil
DTExecUI
帮助资源
SQL Server 2005安装和升级论坛
联机丛书
SQLIS.COM
MSDN
SQL Server Integration Services论坛
小结
第3章 从DTS迁移
影响的范围
SSIS不是DTS
区别的范围
好消息
可用迁移资源
升级顾问
Execute DTS 2000 Package Task(执行DTS 2000包任务)
迁移向导
关于迁移工作的一些考虑
SQL Setver实例和企业管理器
Meta Data Services
迁移带密码的包
小结
第4章 建立一个包——快速入门
快速入门
情景举例
配置数据流
小结
第二部分 Integration services基础和概念
第5章 Business Intelligence Development Studio
入门
“起始页”和“社区”菜单
新建解决方案
Integration Services的选项
SSIS菜单
工具箱
设计器
Visual Studio的标准选项
解决方案资源管理器
“属性”窗口
“变量”窗口
“文件”菜单
“选项”对话框
“调试”窗口
“调用堆栈”窗口
小结
第6章 Integratioil Services的基本构件
Integration Services的基本构件
包和其他对象
任务
变量
连接管理器
日志提供程序
容器
优先约束
数据流任务、适配器和转换
数据流适配器
将数据移人或移出数据流缓冲区
数据流转换
数据流与工作流——基本区别
执行模型
连接线
功能范围
小结
第7章 用容器组合控制流
容器的概念
组织
降低复杂性
作用域划分
事务的作用域
配置的作用域
变量的作用域
执行的作用域
连接的作用域
日志记录的作用域
事件处理器的作用域
容器公共属性
“标识”
“执行”
“强制执行”
“事务”
其他类别中的属性
设计器分组——非容器
任务和Taskhost容器
属性集
持续性
包的路径和配置
调试功能
禁用控制流
自定义注册
联系信息和良好加载故障恢复
隔离
对敏感数据的保护
简单的“序列容器”
循环容器
“包”容器
包的重要属性
小结
第三部分 控制流服务
第8章 存储区任务
普通任务约定
任务用户界面
访问方法
标准选项卡
任务组
工作流任务
执行DTS 2000包任务
“发送邮件任务”
“FTP任务”
“消息队列任务”
“WMI任务”
WMI数据读取器任务
WMI事件观察器任务
Web服务任务
执行包任务
执行进程任务
执行SQL任务
脚本任务
ActiveX脚本任务
数据处理任务
大容量插入任务
XML任务
数据流任务
小结
第9章 表达式的用法
表达式基础知识
表达式函数
列
属性表达式
简单举例
数据流属性表达式
添加数据流属性表达式
变量表达式
优先约束表达式
For循环表达式
小结
第10章 存储区连接管理器
连接管理器
创建连接管理器
存储区连接管理器
ADO连接管理器
ADO.NET连接管理器
Excel连接管理器
文件连接管理器
平面文件连接管理器
连接管理器的设置:高级
FTP连接管理器
连接管理器的设置
HTTP连接管理器
MSMQ连接管理器
微软分析服务连接管理器
MultiFile连接管理器
MultiFlatFile连接管理器
ODBC连接管理器
OLEDB连接管理器
SMOServer连接管理器
SMTP连接管理器
WMI连接管理器
数据源和数据源视图
“数据源”和“数据源视图”简介
小结
第11章 日志记录和存储区日志提供程序
基础知识
快速入门
包日志记录的配置
存储区日志提供程序
Windows事件日志提供程序
文本文件日志提供程序
XML日志提供程序
SQL Server日志提供程序
SQL探查器日志提供程序
设计器日志事件查看器——“虚拟的日志提供程序”
日志记录提供程序和日志记录选项
日志提供程序
日志记录选项
日志记录架构
日志事件
自定义日志记录
使用“脚本任务”和“脚本注释”
使用“SQL任务”
小结
第12章 古老的变量
变量的重要概念——属性、作用域、类型和名称空间
变量的属性
变量的作用域
变量类型
变量的名称空间
系统变量
创建和使用变量
运行时行为
关于变量的提示和技巧
在“执行SQL任务”中使用带参数的“EvaluateAsExpression”
在子包中隐藏父包中的变量
在变量中存储对象
小结
第13章 循环和Foreach枚举器
For循环
While循环
Foreach循环
存储区Foreach枚举器
Foreach文件枚举器
Foreach Item Foreactl ADO
Foreach ADO.NET架构行集
Foreach源变量
Foreach NodeList
Foreach SMO
小结
第四部分 管理服务
第14章 解决方案的配置与部署
包的配置
包配置的工作方式
包配置组织程序
包配置类型
XML配置文件
配置编辑器
环境变量配置
注册表项配置
父包变量配置
SQL Server表配置
包配置小结
包的部署
用于部署的实用程序
配置和部署的方法
与位置相关的和驻留在计算机上的配置
移动的数据库对象
配置替换
配置连接管理器
小结
第15章 “脚本任务”的使用
脚本任务环境
“脚本任务”编辑器
“脚本任务”的使用
Dts对象
建议实践
脚本任务示例
在SSIS对象模型上工作
使用HTTP下载文件
把文本文件的内容装入一个变量
简单的自定义日志记录
异常处理
安全消息框
小结
第16章 源代码管理的使用
什么是源代码管理
源代码库
同步
签出/签入
对比
添加标签
分支
合并
BIDS设计器中的源代码管理
设置
使用源代码管理程序
实践
小结
第17章 SQL server Management Studio
SQL Server Management Studio综述
对象资源管理器
查看Windows事件日志
连接到Integration Services服务器
启动“Integration Services服务器”
连接到本地服务器
连接到远程SSIS服务器
包的管理
包的运行
已存储的包
DTS 2000包的管理
服务器缓冲存储
使用“SQL Server代理”程序执行包
配置Integration Services服务器
重新启动服务器
服务器配置
小结
第18章 包的安全保护
控制对包的访问
包存储在Integration Services服务器
存储在SQL Setver中
标识敏感数据
保护包及其他文件
包的保护级别
保护非包文件
与“SQL Server代理”集成
设置“代理”(Agent)作业来运行SSIS包
代理子系统的路径
检测对包的修改
安全场景设置
三层操作结构
小结
第五部分 数据流任务
第19章 “数据流任务”介绍
管道思想101
低附加开销转换
高性能——没有复制,不开玩笑
数据沙箱
扩展性
数据流术语
数据流属性
可使用表达式的组件属性
存储路径
缓冲区大小属性
引擎线程
RunInOptimizedMode
小结
第20章 存储区中的“数据流”组件
普通组件约定
自定义组件编辑器和高级编辑器
源适配器
DataReader源
“OLE DB源”和“OLE DB目标”适配器
“原始文件源”和“原始文件目标”适配器
“XML源”适配器
流控制转换
条件性拆分
派生列
合并
合并联接
多播
Union All
“查找”转换
“导入列”转换
“导出列”转换
审核转换
“审核”转换
“百分比抽样”和“行抽样”转换
“行计数”转换
数据管理转换
“聚合”转换
“字符映射表”转换
“复制列”转换
“数据转换”组件
“OLE DB命令”转换
“排序”转换
目标适配器
“DataReader目标”适配器
“记录集目标”适配器
“SQL Server目标”适配器
小结
第21章 使用“脚本组件”
“脚本组件”介绍
“脚本组件”具有高性能的特点
建立概念验证模块
访问不常见的或者不支持的数据源
创建源适配器
创建组件
创建目标适配器
创建组件
创建转换
创建组件
异步输出
让脚本输出成为异步输出
小结
第22章 高级数据流转换
渐变维度向导程序和转换
典型的渐变维度
其他渐变维度类型
渐变维度向导
生成的数据流
“渐变维度”组件如何处理数据行
性能方面的考虑
数据净化组件
模糊查找
“模糊分组”转换
设置“模糊分组”转换组件
文本挖掘和文档仓库组件
文本存在的问题
“字词提取”转换
字词提取转换编辑器
“字词查找”转换
小结
第23章 数据流任务内幕和调整
“数据流任务”揭秘
基本概念
布局子系统
缓存
缓存子系统
运行引擎
用于提速的总体设置
消除不必要的处理
数据流优化
插入性能
“数据流”优化方法
约束理论
资源约束的识别和优先级确定
确定如何利用约束
根据前面的决策对其他部分进行协调和同步
提升瓶颈因素的性能
如果在上述任何步骤中约束发生了改变,那么回到第一步
小结
第六部分 Integration Services编程
第24章 创建自定义任务
自定义运行时组件
创建自定义组件的要求
决定该编写什么
启动SSIS自定义组件项目
创建解决方案
添加强名称和密钥文件
引用SSIS及其他程序集
定义类
编译和安装
运行环境如何找到安装的任务
任务的开发和调试
让任务具有一个身份
添加针对具体功能的属性和函数
添加SSIS的专用属性及功能
创建任务用户界面
创建示例任务的用户界面(简单)
创建复杂的任务用户界面(复杂)
自定义任务的最佳实践
约定和约束
任务用户界面
通用原则
小结
第25章 创建自定义数据流组件
自定义组件的概念
设计时
运行时
示例组件
JPG文件EXIF读取器源适配器
数据配置转换
SQL客户和ODBC目标适配器
示例转换组件的用户界面
设计时方法
ProvideComponentProperties
ReinitializeMetaData
Validate
运行时方法
编写源适配器
设置和设计时方法
编写目标适配器
目标适配器的基本处理方式
“ReinitializeMetaData”方法
“PreExecute”方法
“ProcessInput”方法
从输入缓存获取数据
编写转换组件
小结
附录A 错误、警告和信息事件
附录B 表达式求值器参考表
猜您喜欢