书籍详情

数据挖掘原理与应用:SQL Server 2005数据库

数据挖掘原理与应用:SQL Server 2005数据库

作者:(美)唐(Tang,Z.H.),(美)麦克雷南(MaccLennan,J.) 著,邝祝芳,焦贤龙,高升 译

出版社:清华大学出版社

出版时间:2007-01-01

ISBN:9787302140009

定价:¥46.00

购买这本书可以去
内容简介
  本书作为一本专家级指南,全面介绍了SQL Server 2005中数据挖掘的功能,并且对这些功能的应用作了较为详尽的讲述。书中不但讲述了数据挖掘的核心概念,还讲述了数据挖掘的最新发展趋势,并给出了一些数据挖掘的最佳实践。...
作者简介
  本书提供作译者介绍ZhaoHui Tang是Microsoft SQL Server数据挖掘团队的项目经理。. Jamie MacLennan是SQL Server数据挖掘引擎开发团队的开发组长。..ZhaoHui和Jamie是SQL Server数据挖掘组件的核心设计者,他们不仅经常在大型的数据库和数据挖掘会议上作报告,而且还在学术和行业刊物上发表很多有关SQL Server数据挖掘方面的文章。...
目录
1.1  什么是数据挖掘    1
1.2  数据挖掘解决的商业问题    4
1.3  数据挖掘的任务    5
1.3.1  分类    5
1.3.2  聚类    5
1.3.3  关联    6
1.3.4  回归    6
1.3.5  预测    7
1.3.6  序列分析    7
1.3.7  偏差分析    8
1.4  数据挖掘技术    8
1.5  数据流    9
1.6  数据挖掘项目的生命周期    10
1.6.1  第1步:数据收集    10
1.6.2  第2步:数据清理和转换    10
1.6.3  第3步:模型构建    12
1.6.4  第4步:模型评估    12
1.6.5  第5步:报告    13
1.6.6  第6步:预测(评分)    13
1.6.7  第7步:应用集成    13
1.6.8  第8步:模型管理    13
1.7  数据挖掘当前市场与主要厂商    14
1.7.1  数据挖掘市场的大小    14
1.7.2  主要生产厂商和产品    14
1.8  目前存在的问题及挑战    15
1.9  数据挖掘标准    16
1.10  OLE DB for DM规范和
XML for Analysis规范    16
1.10.1  用于数据挖掘的SQL/Multimedia    17
1.10.2  Java数据挖掘API    18
1.10.3  预测模型标记语言    20
1.10.4  Crisp-DM模型    23
1.10.5  公共仓库元数据    24
1.11  数据挖掘的新趋势    25
1.12  本章小结    26
第2章  OLE DB for DM规范    27
2.1  OLE DB介绍    27
2.2  为什么使用OLE DB进行数据挖掘    29
2.3  OLE DB for DM规范中的基本概念    31
2.3.1  事例    31
2.3.2  事例键    32
2.3.3  嵌套键    32
2.3.4  事例表和嵌套表    33
2.3.5  标量列和表列    33
2.3.6  数据挖掘模型    33
2.3.7  模型创建    33
2.3.8  模型训练    33
2.3.9  模型预测    34
2.4  DMX    34
2.4.1  数据挖掘的3个步骤    34
2.4.2  预测函数    43
2.4.3  单例查询    50
2.4.4  仅仅使用内容进行预测    51
2.4.5  钻取模型的内容    52
2.4.6  内容查询    52
2.5  理解模式行集    52
2.5.1  Mining_Services模式行集    53
2.5.2  Service_Parameters模式行集    54
2.5.3  Mining_Models模式行集    54
2.5.4  Mining_Columns模式行集    55
2.5.5  Mining_Model_Content模式行集    55
2.5.6  Query_Content模式行集    58
2.5.7  Mining_Functions模式行集    59
2.5.8  Model_PMML模式行集    60
2.6  理解用于挖掘结构的DMX扩展    60
2.6.1  挖掘结构    60
2.6.2  挖掘结构的DMX扩展    61
2.6.3  Mining Structure模式行集    62
2.7  本章小结    63
第3章  实践SQL Server数据挖掘    65
3.1  BI Dev Studio介绍    65
3.1.1  理解用户界面    66
3.1.2  脱机模式和即时模式    68
3.2  设置数据源    72
3.2.1  数据源    72
3.2.2  使用数据源视图    74
3.3  创建和编辑模型    83
3.3.1  结构和模型    83
3.3.2  使用数据挖掘向导    83
3.3.3  创建MovieClick挖掘结构和挖掘模型    88
3.3.4  使用数据挖掘设计器    89
3.4  处理    94
3.5  使用模型    96
3.5.1  了解模型查看器    96
3.5.2  使用挖掘准确性图表    98
3.5.3  为MovieClick模型创建一个提升图    101
3.5.4  使用挖掘模型预测    101
3.5.5  针对MovieClick模型执行查询    102
3.5.6  创建数据挖掘报表    103
3.6  使用SQL Server Management Studio    104
3.6.1  了解Management Studio用户界面    105
3.6.2  使用对象资源管理器    106
3.6.3  使用查询编辑器    106
3.7  本章小结    107
第4章  Microsoft贝叶斯算法    109
4.1  贝叶斯算法介绍    109
4.2  理解贝叶斯算法的基本原理    110
4.3  贝叶斯算法的参数    112
4.4  使用贝叶斯算法    113
4.4.1  DMX    114
4.4.2  理解贝叶斯模型的内容    115
4.4.3  浏览贝叶斯模型    117
4.5  本章小结    120
第5章  Microsoft决策树算法    121
5.1  决策树算法介绍    121
5.2  决策树算法的基本原理    122
5.2.1  决策树生成的基本思想    122
5.2.2  处理变量中的多个状态    125
5.2.3  避免过度训练    125
5.2.4  结合先验知识    126
5.2.5  特征选择    126
5.2.6  使用连续的输入属性    127
5.2.7  回归    127
5.2.8  使用Microsoft决策树算法进行关联分析    128
5.3  理解算法参数    129
5.4  使用决策树算法    131
5.4.1  DMX查询    131
5.4.2  模型内容    135
5.4.3  解释模型    136
5.5  本章小结    139
第6章  Microsoft时序算法    141
6.1  Microsoft时序算法介绍    141
6.2  Microsoft时序算法的
基本原理    142
6.2.1  自动回归    142
6.2.2  使用多个时间序列    144
6.2.3  自动回归树    144
6.2.4  季节性    145
6.2.5  预测历史    146
6.2.6  高速缓存预测    146
6.3  理解时序算法的参数    147
6.4  使用Microsoft时序算法    148
6.4.1  DMX查询    148
6.4.2  模型内容    152
6.4.3  模型解释    152
6.5  本章小结    155
第7章  Microsoft聚类算法    157
7.1  Microsoft聚类算法介绍    158
7.2  聚类算法的基本原理    159
7.2.1  硬聚类算法与软聚类算法    160
7.2.2  离散聚类    161
7.2.3  可伸缩聚类    162
7.2.4  聚类预测    163
7.3  聚类算法的参数    163
7.4  使用聚类模型    166
7.4.1  将聚类作为一个分析步骤    166
7.4.2  DMX    167
7.4.3  模型内容    169
7.4.4  理解聚类模型    169
7.5  本章小结    174
第8章  Microsoft序列聚类算法    175
8.1  Microsoft序列聚类算法介绍    175
8.2  Microsoft序列聚类算法的基本原理    176
8.2.1  什么是马尔可夫链    176
8.2.2  马尔可夫链的阶    176
8.2.3  状态转移矩阵    177
8.2.4  使用马尔可夫链来进行聚类    178
8.2.5  聚类分解    180
8.3  序列聚类算法的参数    180
8.4  使用序列聚类算法    181
8.4.1  DMX查询    181
8.4.2  模型内容    185
8.4.3  解释模型    185
8.5  本章小结    189
第9章  Microsoft关联规则算法    191
9.1  Microsoft关联规则算法介绍    191
9.2  关联规则算法的基本原理    192
9.2.1  理解关联规则算法的基本概念    192
9.2.2  挖掘频繁项集    195
9.2.3  生成关联规则    198
9.2.4  预测    198
9.3  关联算法的参数    199
9.4  使用关联算法    200
9.4.1  DMX查询    200
9.4.2  模型内容    202
9.4.3  解释模型    203
9.5  本章小结    205
第10章  Microsoft神经网络算法    207
10.1  Microsoft神经网络算法的基本原理    207
10.1.1  什么是神经网络    208
10.1.2  组合和激活    209
10.1.3  反向传播、误差函数和共轭梯度    211
10.1.4  处理神经网络的简单示例    212
10.1.5  规范化和映射    213
10.1.6  网络拓扑    214
10.1.7  训练终止条件    215
10.2  神经网络算法的参数    215
10.3  DMX查询    216
10.4  模型内容    218
10.5  解释模型    219
10.6  本章小结    221
第11章  挖掘OLAP立方体    223
11.1  OLAP介绍    224
11.1.1  理解星型模式和雪花模式    225
11.1.2  理解维和层次    225
11.1.3  理解度量和度量组    226
11.1.4  理解立方体的处理和存储    227
11.1.5  使用前摄缓存    228
11.1.6  查询立方体    228
11.2  执行计算    229
11.3  浏览立方体    230
11.4  理解统一维度模型    231
11.5  理解OLAP和数据挖掘之间的关系    234
11.5.1  OLAP在聚集数据方面给数据挖掘带来的好处    235
11.5.2  OLAP需要数据挖掘来发现模式    235
11.5.3  OLAP挖掘与关系挖掘    236
11.6  使用向导和编辑器来构建OLAP挖掘模型    237
11.6.1  使用数据挖掘向导    237
11.6.2  构建客户细分模型    237
11.6.3  创建购物篮模型    239
11.6.4  创建销售预测模型    242
11.6.5  使用数据挖掘编辑器    245
11.7  理解数据挖掘维    246
11.8  在DMX查询内部使用MDX    248
11.9  将AMO用于OLAP挖掘模型    249
11.10  本章小结    253
第12章  SQL Server集成服务
数据挖掘    255
12.1  SSIS介绍    255
12.1.1  理解SSIS包    257
12.1.2  任务流    257
12.1.3  数据流    259
12.2  在SSIS环境中进行数据挖掘    261
12.2.1  数据挖掘任务    262
12.2.2  数据挖掘转换    267
12.3  本章小结    276
第13章  SQL Server数据挖掘的体系结构    277
13.1  Analysis Services体系
结构介绍    277
13.2  XML for Analysis    278
13.2.1  XMLA的API    279
13.2.2  XMLA和Analysis Services    282
13.3  处理体系结构    283
13.4  数据挖掘管理    284
13.4.1  服务器配置    284
13.4.2  数据挖掘安全    285
13.5  本章小结    287
第14章  SQL Server数据挖掘编程    289
14.1  数据挖掘API    290
14.1.1  ADO    291
14.1.2  ADO.NET    291
14.1.3  ADOMD.NET    291
14.1.4  Server ADOMD    292
14.1.5  AMO    292
14.2  使用Analysis Services的API    292
14.3  使用Microsoft.AnalysisServices
创建和管理挖掘模型    293
14.3.1  AMO的基本原理    294
14.3.2  AMO应用程序和安全    295
14.3.3  对象的创建    296
14.4  浏览和查询挖掘模型    305
14.4.1  使用ADOMD.NET来预测    306
14.4.2  浏览模型    309
14.4.3  存储过程    311
14.4.4  编写存储过程    312
14.5  本章小结    317
第15章  实现一个Web交叉销售
应用程序    319
15.1  源数据描述    319
15.2  构建模型    320
15.2.1  确定数据挖掘任务    320
15.2.2  将决策树算法应用于关联任务    320
15.2.3  使用关联规则算法    322
15.2.4  两个模型的比较    324
15.3  执行预测    325
15.3.1  批处理预测查询    325
15.3.2  使用单例预测查询    327
15.4  在Web应用程序中集成预测功能    327
15.4.1  理解Web应用程序的体系结构    327
15.4.2  设置权限    328
15.4.3  分析Web推荐应用程序的样例代码    329
15.5  本章小结    332
第16章  使用Microsoft Excel进行高级预测    333
16.1  针对会话模型来配置Analysis Services    333
16.2  使用高级预测工具    334
16.3  ExcelTimeSeries插件的体系结构    336
16.4  构建输入数据集    336
16.5  创建和训练挖掘模型    339
16.5.1  连接数据挖掘引擎    339
16.5.2  创建和训练    340
16.6  预测序列    342
16.7  结合所有代码    343
16.8  本章小结    346
第17章  扩展SQL Server数据挖掘    347
17.1  理解插件算法    347
17.1.1  插件算法的架构    348
17.1.2  插件算法的概念    348
17.1.3  模型的创建和处理    350
17.1.4  预测    351
17.1.5  内容导航    352
17.1.6  受托管的插件    352
17.1.7  安装插件算法    353
17.2  使用数据挖掘查看器    353
17.3  本章小结    354
第18章  总结与其他资源    355
18.1  重新回顾SQL Server 2005
数据挖掘的亮点    355
18.1.1  最新的算法    355
18.1.2  易于使用的工具    356
18.1.3  简单而强大的API    356
18.1.4  与同类BI技术的集成    357
18.2  探讨数据挖掘的新领域及应用357
18.3  延伸阅读    358
18.3.1  Microsoft数据挖掘的资源358
18.3.2  数据挖掘的其他资源    358
18.3.3  流行的数据挖掘Web站点359
18.3.4  流行的数据挖掘会议    359
附录A  导入数据集    361
A.1  数据集    361
A.1.1  MovieClick数据集    361
A.1.2  Voting Records数据集    363
A.1.3  FoodMart 2000数据集    364
A.1.4  College Plans数据集    364
A.2  导入数据集    364
附录B  支持的VBA函数和
Excel函数    369
附录C  学习资源    373





猜您喜欢

读书导航