书籍详情

基于SPSS Modeler的数据挖掘(第二版)

基于SPSS Modeler的数据挖掘(第二版)

作者:薛薇 著

出版社:中国人民大学出版社

出版时间:2014-10-01

ISBN:9787300200699

定价:¥49.00

购买这本书可以去
内容简介
  数据挖掘具有广阔的应用领域和发展前景。SPSS Modeler因界面友好且操作简捷,成为公认的数据挖掘实战的首选软件。基于多年的教学和科研经验,作者深知数据挖掘理论和软件操作相结合的重要性,努力在本书中突出以下特点:以数据挖掘过程为线索讲解Modeler软件操作。本书以数据挖掘实践过程为主线,从Modeler数据管理入手,说明问题由浅入深,讲解方法从易到难,旨在使读者在较短时间内掌握Modeler的基本功能和一般方法,并迅速运用到数据挖掘实战中。数据挖掘理论的讲解通俗易懂,避免数学公式的罗列。本书对Modeler中的经典数据挖掘算法娓娓道来,旨在使读者知其然更知其所以然,加深对数据挖掘分析结论的理解和应用。将数据挖掘方法、软件操作、案例分析有机结合。本书在论述数据挖掘方法核心思想和基本原理的同时,配合案例数据展示实战过程,旨在使读者直观理解理论,正确应用方法。
作者简介
  薛薇,工学硕士,经济学博士,中国人民大学应用统计科学研究中心副主任,中国人民大学统计学院副教授。关注数据挖掘及统计建模、统计和数据挖掘软件应用、统计数据库系统研发等方面。涉足网络新媒体舆论传播和互动建模、政府和官方微博分析、电商数据分析、学科学术热点跟踪等文本挖掘,以及社会网络分析和以数据挖掘为依托的客户关系管理等领域。
目录
第1章数据挖掘和Modeler使用概述
1.1数据挖掘的产生背景
1.2什么是数据挖掘
1.3Modeler软件概述

第2章Modeler的数据读入和数据集成
2.1变量类型
2.2读入数据
2.3生成实验方案
2.4数据集成

第3章Modeler的数据理解
3.1变量说明
3.2数据质量的评估和调整
3.3数据的排序
3.4数据的分类汇总

第4章Modeler的数据准备
4.1变量变换
4.2变量派生
4.3数据精简
4.4数据筛选
4.5数据准备的其他工作

第5章Modeler的基本分析
5.1数值型变量的基本分析
5.2两分类型变量相关性的研究
5.3两总体的均值比较
5.4RFM分析

第6章Modeler的数据精简
6.1变量值的离散化处理
6.2特征选择
6.3因子分析

第7章分类预测:Modeler的决策树
7.1决策树算法概述
7.2Modeler的C5?0算法及应用
7.3Modeler的分类回归树及应用
7.4Modeler的CHAID算法及应用
7.5Modeler的QUEST算法及应用
7.6模型的对比分析

第8章分类预测:Modeler的人工神经网络
8.1人工神经网络算法概述
8.2Modeler的B?P反向传播网络
8.3Modeler的B?P反向传播网络的应用
8.4Modeler的径向基函数网络及应用

第9章分类预测:Modeler的支持向量机
9.1支持向量分类的基本思路
9.2支持向量分类的基本原理
9.3支持向量回归
9.4支持向量机的应用

第10章分类预测:Modeler的贝叶斯网络
10.1贝叶斯方法基础
10.2贝叶斯网络概述
10.3TAN贝叶斯网络
10.4马尔科夫毯网络
10.5贝叶斯网络的应用

第11章探索内部结构:Modeler的聚类分析
11.1聚类分析的一般问题
11.2Modeler的K?Means聚类及应用
11.3Modeler的两步聚类及应用
11.4Modeler的Kohonen网络聚类及应用
11.5基于聚类分析的离群点探索

第12章探索内部结构:Modeler的关联分析
12.1简单关联规则及其有效性
12.2Modeler的Apriori算法及应用
12.3Modeler的序列关联及应用

参考文献
猜您喜欢

读书导航