数据分析从入门到进阶
作者:陈红波,刘顺祥 等
出版社:机械工业出版社
出版时间:2019-07-01
ISBN:9787111628828
定价:¥79.90
前言
第1章 数据分析入门1
1.1 什么是数据分析1
1.1.1 数据分析的含义1
1.1.2 数据分析的操作步骤2
1.1.3 数据分析的应用场景5
1.1.4 数据分析的发展趋势8
1.2 数据分析的职业发展及分类8
1.3 数据分析之道10
1.3.1 三类统计分析策略10
1.3.2 数据分析的常用方法17
1.4 数据分析之术22
1.4.1 必备的Excel处理方法22
1.4.2 高超的数据库查询技巧23
1.4.3 纯熟的数据可视化技能23
1.4.4 高大上的统计编程技术26
第2章 数据分析——从玩转Excel开始28
2.1 Excel概述28
2.1.1 强大的数据处理技能28
2.1.2 实用的数据分析技巧29
2.1.3 丰富的数据可视化图表30
2.1.4 便捷的自动化数据处理30
2.1.5 快速实现业务报表开发32
2.2 高效处理数据的Excel函数家族34
2.2.1 常用的统计分析函数35
2.2.2 灵活的文本处理函数49
2.2.3 便捷的数值运算函数59
2.2.4 经典的逻辑判断函数68
2.2.5 实用的日期计算函数74
2.2.6 高效的匹配查找函数80
2.3 十分有用的Excel数据分析技巧94
2.3.1 数据透视表实现统计分析95
2.3.2 描述性统计分析113
2.3.3 相关系数与协方差115
2.3.4 线性回归模型预测118
2.3.5 移动平均模型预测121
2.4 酷炫的Excel图表可视化123
2.4.1 Excel基础图表123
2.4.2 高级可视化图表135
2.5 让你的Excel报表动起来141
2.5.1 VBA基础语法142
2.5.2 录制宏,解放你的双手152
2.5.3 VBA应用:学生成绩信息统计154
2.5.4 VBA应用:报表发送前的一键优化155
2.5.5 VBA应用:数据库字典的超链接156
2.5.6 VBA应用:一键合并拆分工作簿158
2.5.7 VBA应用:从数据库获取并更新数据163
第3章 海量数据管理——拿MySQL说事儿174
3.1 MySQL数据库的安装174
3.2 将数据写入到数据库中178
3.2.1 常用的数据类型178
3.2.2 手工建表181
3.2.3 数据插入183
3.2.4 外部数据的批量导入186
3.3 重要的单表查询191
3.3.1 SQL查询的7个核心关键词——以链家二手房数据为例192
3.3.2 基于CASE WHEN的常用查询——以电商交易数据为例201
3.3.3 几种常见的嵌套查询——以学员考试成绩为例205
3.3.4 基于分组排序的辅助列功能——以销售员业绩数据为例210
3.4 复杂的多表查询214
3.4.1 纵向表合并——以超市交易数据为例215
3.4.2 表连接操作——以校园一卡通记录数据为例217
3.5 通过索引提高数据的查询速度224
3.5.1 常见的索引类型224
3.5.2 索引的查询和删除229
3.5.3 关于索引的注意事项230
3.6 数据库的增删改操作231
3.6.1 数据库的增操作231
3.6.2 数据库的删操作232
3.6.3 数据库的改操作235
第4章 数据可视化——Tableau的使用238
4.1 数据可视化概述238
4.1.1 什么是数据可视化238
4.1.2 为什么要实现数据可视化240
4.2 Tableau概述241
4.2.1 软件安装241
4.2.2 连接数据源243
4.2.3 数据源界面249
4.2.4 工作区界面251
4.2.5 高级操作259
4.2.6 保存结果264
4.3 数据可视化图表265
4.3.1 条形图266
4.3.2 柱形图267
4.3.3 折线图268
4.3.4 面积图271
4.3.5 符号图272
4.3.6 树状图272
4.3.7 气泡图273
4.3.8 文字云273
4.3.9 饼图274
4.3.10 热图274
4.3.11 盒须图275
4.3.12 双轴图276
4.3.13 动态图表277
4.3.14 参数图表279
4.3.15 漏斗图282
4.4 仪表板的制作与发布286
4.4.1 仪表板的制作286
4.4.2 可视化成果发布288
第5章 数据分析进阶——Python数据分析291
5.1 数据分析的利器——Python291
5.1.1 Anoconda——Python集成开发环境的安装292
5.1.2 Python编程工具的选择295
5.2 Jupyter的使用技巧297
5.2.1 代码运行组合键297
5.2.2 代码框操作组合键297
5.2.3 注释组合键297
5.2.4 帮助组合键298
5.2.5 代码与笔记的切换组合键298
5.3 数据读取——从pandas开始299
5.3.1 文本文件的读取299
5.3.2 电子表格的读取301
5.3.3 数据库数据的读取303
5.4 常见的数据处理技术306
5.4.1 数据的概览与清洗306
5.4.2 数据的引用312
5.4.3 多表合并与连接314
5.4.4 数据的汇总319
5.5 探索性数据分析324
5.5.1 异常数据的检测与处理324
5.5.2 数据的描述331
5.5.3 数据的推断348
5.6 线性回归模型的应用358
5.6.1 简单线性回归模型——刹车距离的研究359
5.6.2 多元线性回归模型——产品市场销售额的研究363
5.6.3 模型的显著性检验——F检验365
5.6.4 回归系数的显著性检验——t检验367
5.6.5 基于回归模型识别异常点370
5.6.6 模型的预测372