书籍详情
数据分析与数据可视化实战
作者:张延松 著
出版社:电子工业出版社
出版时间:2020-05-01
ISBN:9787121379925
定价:¥69.00
购买这本书可以去
内容简介
本书以企业级基准数据集为实战案例,系统地介绍了目前比较前沿、比较具有代表性的数据分析与数据可视化工具的使用方法,涵盖了从数据管理到数据抓取、数据可视化、数据挖掘建模的整个企业级数据分析流程,使读者能够掌握企业级数据分析处理的基本技能,为承担企业级数据分析处理或其他领域的相关任务打下基础。本书可以作为经济、人文、社会、管理学科学生学习数据分析与数据可视化技术的入门教材,也可以作为计算机专业、信息类专业本科生的教材或参考书,同样也可以作为企业数据分析人员的参考书。
作者简介
张延松,男,博士,副教授,2010年在中国人民大学获得计算机应用工学博士学位,2010年进入中国人民大学应用经济学博士后流动站从事博士后研究工作。2012年进入中国人民大学信息学院任教,并在中国人民大学中国调查与数据中心任职,主要研究方向为大数据分析技术,内存数据库,数据仓库等,在相关研究领域的国内、国外学术会议及期刊已发表论文20余篇,申请多项国内、国外发明专利,在内存数据库和新硬件数据库方向已获得12项国内发明专利、4项美国PCT发明专利授权。2016年获得教育部科技进步一等奖(4/7),2015年获得中国计算机学会科技进步奖一等奖(7/10),2017年获得北京市第十四届哲学社会科学优秀成果奖二等奖。
目录
目 录
第一篇 预 备 篇
第1章 数据分析与数据库的初步认识
1.1 数据分析的基本概念
1.1.1 大数据与数据价值
1.1.2 数据、数据分析与数据挖掘
1.1.3 数据可视化
1.1.4 数据驱动决策
1.1.5 数据分析师在企业中扮演的角色
1.2 数据库的基本概念
1.2.1 企业级关系型数据库
1.2.2 主键与外键
1.2.3 维度与度量
1.2.4 日期分区
1.3 数据分析的一般流程
1.3.1 定义数据分析目标
1.3.2 数据预处理
1.3.3 数据分析与模型搭建
1.3.4 数据产品上线与维护
本章小结
第2章 TPC-DS 数据分析案例简介
2.1 数据集简介
2.2 数据集结构解析
2.2.1 store sales网络
2.2.2 catalog sales网络
2.2.3 website sales网络
2.2.4 inventory网络
2.3 数据集字段解析
2.3.1 事实表字段解析
2.3.2 维度表字段解析
2.4 启示与挑战
本章小结
第二篇 技 能 篇
第3章 企业级数据分析环境的搭建
3.1 SQL Server 2019 数据库管理工具
3.1.1 SQL Server 2019 安装与配置
3.1.2 新建TPC-DS 数据库
3.1.3 通过数据导入向导导入 TPC-DS 数据集
3.1.4 通过 Bulk Insert 命令导入 TPC-DS 数据集
3.1.5 通过数据导出向导导出数据
3.2 Excel Power 插件数据分析工具
3.2.1 Excel Power 插件的调用
3.2.2 Power Pivot 连接 SQL Server 2019数据库
3.2.3 Power View 与 Power Map的调用
3.3 Power BI Desktop 数据分析工具
3.3.1 Power BI Desktop 简介与安装
3.3.2 Power BI Desktop 连接 SQL Server 2019 数据库
3.4 Tableau Desktop & Prep 数据分析工具
3.4.1 Tableau Desktop & Prep 安装与配置
3.4.2 Tableau Desktop 连接 SQL Server 2019 数据库
3.4.3 Tableau Prep 应用基础
3.5 Python数据分析工具
3.5.1 Python简介与安装
3.5.2 Python 连接 SQL Server 2019 数据库
3.5.3 通过 Python 代码导入 TPC-DS 数据集
本章小结
第4章 结构化查询语言SQL
4.1 SQL数据查询概述
4.2 单表查询
4.2.1 投影操作
4.2.2 选择操作
4.2.3 聚集操作
4.2.4 分组操作
4.2.5 排序操作
4.3 连接查询
4.3.1 等值、非等值连接
4.3.2 自身连接
4.3.3 外连接
4.3.4 多表连接
4.4 嵌套查询
4.4.1 包含in谓词的子查询
4.4.2 带有比较运算符的相关子查询
4.4.3 带有any或all谓词的子查询
4.4.4 带有exist谓词的子查询
4.5 集合查询
4.5.1 集合并运算
4.5.2 集合交运算
4.5.3 集合差运算
4.5.4 多值列集合差运算
4.6 基于派生表的查询
4.7 复杂查询案例解析
4.7.1 复杂查询案例1
4.7.2 复杂查询案例2
4.7.3 复杂查询案例3
4.7.4 复杂查询案例4
4.7.5 复杂查询案例5
4.8 SQL 语言的其他功能
4.8.1 数据定义 SQL
4.8.2 数据更新 SQL
4.8.3 视图的定义和使用
本章小结
第5章 数据可视化基础
5.1 工作界面布局
5.2 基本可视化组件
5.2.1 堆积条形图
5.2.2 簇状条形图
5.2.3 折线图
5.2.4 组合图
5.2.5 饼状图与环状图
5.2.6 表格与矩阵
5.2.7 仪表与卡片
5.2.8 基本可视化应用小结
5.3 进阶可视化组件
5.3.1 排名图
5.3.2 瀑布图
5.3.3 树状图
5.3.4 直方图
5.3.5 盒须图
5.3.6 散点图
5.3.7 词云图
5.3.8 弦图与桑基图
5.3.9 R & Python视觉对象
5.3.10 进阶可视化应用小结
5.4 分析板块的应用
5.4.1 汇总功能
5.4.2 模型功能
5.4.3 自定义功能
5.5 仪表板与故事
5.5.1 创建仪表板
5.5.2 创建故事
本章小结
第三篇 实 战 篇
第6章 用户数据分析与挖掘实战
6.1 引言
6.2 用户宏观监控仪表板设计
6.2.1 设计目的
6.2.2 可视化效果
6.2.3 组件介绍
6.2.4 小结
6.3 用户微观监控仪表板设计
6.3.1 设计目的
6.3.2 可视化效果
6.3.3 组件介绍
6.3.4 小结
6.4 用户价值识别模型(RFM模型)
6.4.1 背景简介
6.4.2 目标定义与数据获取
6.4.3 数据预处理与分析
6.4.4 建立模型
6.4.5 模型评价与应用
6.4.6 小结
6.5 用户优惠券使用行为预测模型
6.5.1 背景简介
6.5.2 目标定义与特征工程
6.5.3 数值质量诊断与变量描述性统计
6.5.4 数据预处理
6.5.5 模型建立与效果评估
6.5.6 小结
本章小结
第7章 供应链数据分析与挖掘实战
7.1 引言
7.2 用户偏好维度供应链监控仪表板设计
7.2.1 设计目的
7.2.2 可视化效果
7.2.3 组件介绍
7.2.4 小结
7.3 用户满足维度供应链监控仪表板设计
7.3.1 设计目的
7.3.2 可视化效果
7.3.3 组件介绍
7.3.4 小结
7.4 产品需求量预测模型
7.4.1 背景简介
7.4.2 数据准备
7.4.3 数据预分析
7.4.4 产品行为模式聚类
7.4.5 时间序列建模与效果评估
7.4.6 小结
本章小结
第一篇 预 备 篇
第1章 数据分析与数据库的初步认识
1.1 数据分析的基本概念
1.1.1 大数据与数据价值
1.1.2 数据、数据分析与数据挖掘
1.1.3 数据可视化
1.1.4 数据驱动决策
1.1.5 数据分析师在企业中扮演的角色
1.2 数据库的基本概念
1.2.1 企业级关系型数据库
1.2.2 主键与外键
1.2.3 维度与度量
1.2.4 日期分区
1.3 数据分析的一般流程
1.3.1 定义数据分析目标
1.3.2 数据预处理
1.3.3 数据分析与模型搭建
1.3.4 数据产品上线与维护
本章小结
第2章 TPC-DS 数据分析案例简介
2.1 数据集简介
2.2 数据集结构解析
2.2.1 store sales网络
2.2.2 catalog sales网络
2.2.3 website sales网络
2.2.4 inventory网络
2.3 数据集字段解析
2.3.1 事实表字段解析
2.3.2 维度表字段解析
2.4 启示与挑战
本章小结
第二篇 技 能 篇
第3章 企业级数据分析环境的搭建
3.1 SQL Server 2019 数据库管理工具
3.1.1 SQL Server 2019 安装与配置
3.1.2 新建TPC-DS 数据库
3.1.3 通过数据导入向导导入 TPC-DS 数据集
3.1.4 通过 Bulk Insert 命令导入 TPC-DS 数据集
3.1.5 通过数据导出向导导出数据
3.2 Excel Power 插件数据分析工具
3.2.1 Excel Power 插件的调用
3.2.2 Power Pivot 连接 SQL Server 2019数据库
3.2.3 Power View 与 Power Map的调用
3.3 Power BI Desktop 数据分析工具
3.3.1 Power BI Desktop 简介与安装
3.3.2 Power BI Desktop 连接 SQL Server 2019 数据库
3.4 Tableau Desktop & Prep 数据分析工具
3.4.1 Tableau Desktop & Prep 安装与配置
3.4.2 Tableau Desktop 连接 SQL Server 2019 数据库
3.4.3 Tableau Prep 应用基础
3.5 Python数据分析工具
3.5.1 Python简介与安装
3.5.2 Python 连接 SQL Server 2019 数据库
3.5.3 通过 Python 代码导入 TPC-DS 数据集
本章小结
第4章 结构化查询语言SQL
4.1 SQL数据查询概述
4.2 单表查询
4.2.1 投影操作
4.2.2 选择操作
4.2.3 聚集操作
4.2.4 分组操作
4.2.5 排序操作
4.3 连接查询
4.3.1 等值、非等值连接
4.3.2 自身连接
4.3.3 外连接
4.3.4 多表连接
4.4 嵌套查询
4.4.1 包含in谓词的子查询
4.4.2 带有比较运算符的相关子查询
4.4.3 带有any或all谓词的子查询
4.4.4 带有exist谓词的子查询
4.5 集合查询
4.5.1 集合并运算
4.5.2 集合交运算
4.5.3 集合差运算
4.5.4 多值列集合差运算
4.6 基于派生表的查询
4.7 复杂查询案例解析
4.7.1 复杂查询案例1
4.7.2 复杂查询案例2
4.7.3 复杂查询案例3
4.7.4 复杂查询案例4
4.7.5 复杂查询案例5
4.8 SQL 语言的其他功能
4.8.1 数据定义 SQL
4.8.2 数据更新 SQL
4.8.3 视图的定义和使用
本章小结
第5章 数据可视化基础
5.1 工作界面布局
5.2 基本可视化组件
5.2.1 堆积条形图
5.2.2 簇状条形图
5.2.3 折线图
5.2.4 组合图
5.2.5 饼状图与环状图
5.2.6 表格与矩阵
5.2.7 仪表与卡片
5.2.8 基本可视化应用小结
5.3 进阶可视化组件
5.3.1 排名图
5.3.2 瀑布图
5.3.3 树状图
5.3.4 直方图
5.3.5 盒须图
5.3.6 散点图
5.3.7 词云图
5.3.8 弦图与桑基图
5.3.9 R & Python视觉对象
5.3.10 进阶可视化应用小结
5.4 分析板块的应用
5.4.1 汇总功能
5.4.2 模型功能
5.4.3 自定义功能
5.5 仪表板与故事
5.5.1 创建仪表板
5.5.2 创建故事
本章小结
第三篇 实 战 篇
第6章 用户数据分析与挖掘实战
6.1 引言
6.2 用户宏观监控仪表板设计
6.2.1 设计目的
6.2.2 可视化效果
6.2.3 组件介绍
6.2.4 小结
6.3 用户微观监控仪表板设计
6.3.1 设计目的
6.3.2 可视化效果
6.3.3 组件介绍
6.3.4 小结
6.4 用户价值识别模型(RFM模型)
6.4.1 背景简介
6.4.2 目标定义与数据获取
6.4.3 数据预处理与分析
6.4.4 建立模型
6.4.5 模型评价与应用
6.4.6 小结
6.5 用户优惠券使用行为预测模型
6.5.1 背景简介
6.5.2 目标定义与特征工程
6.5.3 数值质量诊断与变量描述性统计
6.5.4 数据预处理
6.5.5 模型建立与效果评估
6.5.6 小结
本章小结
第7章 供应链数据分析与挖掘实战
7.1 引言
7.2 用户偏好维度供应链监控仪表板设计
7.2.1 设计目的
7.2.2 可视化效果
7.2.3 组件介绍
7.2.4 小结
7.3 用户满足维度供应链监控仪表板设计
7.3.1 设计目的
7.3.2 可视化效果
7.3.3 组件介绍
7.3.4 小结
7.4 产品需求量预测模型
7.4.1 背景简介
7.4.2 数据准备
7.4.3 数据预分析
7.4.4 产品行为模式聚类
7.4.5 时间序列建模与效果评估
7.4.6 小结
本章小结
猜您喜欢