书籍详情
Python数据分析从入门到精通(第2版)
作者:明日科技
出版社:清华大学出版社
出版时间:2023-11-01
ISBN:9787302646785
定价:¥89.80
购买这本书可以去
内容简介
《Python数据分析从入门到精通(第2版)》从数据分析初学者角度出发,以通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行数据分析程序开发应掌握的各方面技术。全书共分21章,包括数据分析基础、搭建数据分析开发环境、NumPy模块之数组计算、Pandas模块基础、Pandas模块之数据的读取、Pandas模块之数据的处理、Pandas模块之数据的清洗、数据的计算与格式化、数据统计及透视表、处理日期与时间、Scikit-Learn机器学习模块、Matplotlib模块入门、Matplotlib模块进阶、Seaborn图表、Plotly图表、Bokeh图表、Pyecharts图表等内容,以及4个项目实战综合案例。书中所有知识结合具体实例进行介绍,涉及的程序代码给出了详细的注释,读者可轻松领会Python数据分析程序开发的精髓,从而快速提升数据分析开发技能。
作者简介
明日科技,全称是吉林省明日科技有限公司,是一家专业从事软件开发、教育培训以及软件开发教育资源整合的高科技公司,其编写的教材非常注重选取软件开发中的必需、常用内容,同时也很注重内容的易学、方便性以及相关知识的拓展性,深受读者喜爱。其教材多次荣获“全行业优秀畅销品种”“全国高校出版社优秀畅销书”等奖项,多个品种长期位居同类图书销售排行榜的前列。
目录
第1篇 基础知识
第1章 数据分析基础 2
视频讲解:27分钟
1.1 数据分析概述 2
1.2 常见数据分析方法 3
1.2.1 对比分析法 3
1.2.2 同比分析法 4
1.2.3 环比分析法 4
1.2.4 回归分析法 5
1.2.5 聚类分析法 6
1.3 了解数据分析工具 6
1.4 数据分析的基本流程 7
1.4.1 确认目标 7
1.4.2 获取数据 8
1.4.3 处理数据 9
1.4.4 分析数据 10
1.4.5 验证结果 10
1.4.6 展示数据 10
1.4.7 应用数据 11
1.5 数据分析常用模块库 11
1.6 小结 12
第2章 搭建数据分析开发环境 13
视频讲解:19分钟
2.1 强大的编程语言Python 13
2.1.1 Python概述 13
2.1.2 安装Python 13
2.1.3 创建第一个Python程序 17
2.2 安装Anaconda开发环境 18
2.3 Jupyter Notebook开发工具 23
2.3.1 初识Jupyter Notebook 23
2.3.2 创建Jupyter Notebook文件 24
2.3.3 测试Jupyter Notebook 24
2.4 PyCharm集成开发环境 26
2.4.1 PyCharm的下载与安装 26
2.4.2 配置PyCharm 29
2.4.3 测试PyCharm 30
2.5 小结 32
第3章 NumPy模块之数组计算 33
视频讲解:265分钟
3.1 NumPy模块概述 33
3.1.1 什么是NumPy模块 33
3.1.2 安装NumPy模块 34
3.1.3 NumPy的数据类型 35
3.1.4 ndarray()数组对象 36
3.1.5 dtype数据类型对象 37
3.2 创建数组 37
3.2.1 创建简单的数组 38
3.2.2 多种创建数组的方式 39
3.2.3 根据数值范围创建数组 41
3.2.4 生成随机数组 43
3.2.5 在已有的数组中创建数组 45
3.3 数组的基本操作 49
3.3.1 数组的多种运算方式 49
3.3.2 数组的索引和切片 51
3.3.3 数组的重塑 55
3.3.4 数组的增、删、改、查 57
3.4 矩阵的基本操作 59
3.4.1 创建矩阵 60
3.4.2 矩阵的运算 62
3.4.3 矩阵的转换 64
3.5 NumPy常用的数学运算函数 65
3.5.1 算术函数 66
3.5.2 舍入函数 67
3.5.3 三角函数 68
3.6 统计分析 69
3.6.1 求和函数sum() 70
3.6.2 平均值函数mean() 70
3.6.3 最大值与最小值函数max()、min() 71
3.6.4 中位数函数median() 71
3.6.5 加权平均函数average() 72
3.6.6 方差与标准差函数var()、std() 73
3.7 数组排序 73
3.7.1 sort()函数 73
3.7.2 argsort()函数 74
3.7.3 lexsort()函数 74
3.8 小结 75
第4章 Pandas模块基础 76
视频讲解:67分钟
4.1 安装Pandas模块 76
4.2 了解Pandas模块 78
4.3 Pandas模块的两大数据结构 79
4.3.1 Series()对象 79
4.3.2 DataFrame()对象 80
4.4 数据中的索引 82
4.4.1 什么是索引 82
4.4.2 Series()对象的索引 83
4.4.3 DataFrame()对象的索引 86
4.5 小结 88
第5章 Pandas模块之数据的读取 89
视频讲解:75分钟
5.1 读取文本文件中的数据 89
5.2 Excel文件的读取和写入 90
5.2.1 读取Excel文件中的数据 90
5.2.2 读取指定Sheet页中的数据 93
5.2.3 通过行列索引读取指定数据 93
5.2.4 将数据写入Excel文件中 95
5.3 CSV文件的读取和写入 96
5.3.1 读取CSV文件中的数据 96
5.3.2 将数据写入CSV文件中 98
5.4 读取HTML网页 99
5.5 读取数据库中的数据 101
5.5.1 读取MySQL数据库中的数据 101
5.5.2 读取MongoDB数据库中的数据 104
5.6 小结 108
第6章 Pandas模块之数据的处理 109
视频讲解:96分钟
6.1 数据抽取 109
6.1.1 抽取指定行数据 110
6.1.2 抽取多行数据 110
6.1.3 抽取指定列数据 111
6.1.4 抽取指定的行、列数据 112
6.2 数据的增、删、改、查 113
6.2.1 增加数据 113
6.2.2 按行增加数据 114
6.2.3 删除数据 115
6.2.4 修改数据 116
6.2.5 查询数据 117
6.3 数据的排序和排名 120
6.3.1 数据的排序 120
6.3.2 数据排名 123
6.4 小结 125
第7章 Pandas模块之数据的清洗 126
视频讲解:81分钟
7.1 缺失值的处理 126
7.1.1 了解数据中的缺失值 126
7.1.2 查看缺失值 127
7.1.3 处理缺失值 128
7.2 处理数据中的重复值 129
7.3 数据中异常值的检测与处理 130
7.4 数据中字符串的操作函数 131
7.4.1 字符串对象中的常见函数 131
7.4.2 替换字符串——replace()函数 133
7.4.3 数据切分——split()函数 134
7.4.4 判断字符串——contains()函数 135
7.5 数据转换 136
7.5.1 通过字典映射的方式实现数据转换——map()函数 136
7.5.2 数据分割——cut()函数 137
7.5.3 数据分类——get_dummies()函数 138
7.6 小结 139
第8章 数据的计算与格式化 140
视频讲解:54分钟
8.1 常见的数据计算函数 140
8.1.1 求和——sum()函数 140
8.1.2 求平均值——mean()函数 141
8.1.3 求最大值——max()函数 142
8.1.4 求最小值——min()函数 143
8.2 高级的数据计算函数 144
8.2.1 求取中位数——median()函数 144
8.2.2 求取众数——mode()函数 145
8.2.3 计算方差——var()函数 146
8.2.4 计算标准差——std()函数 147
8.2.5 计算分位数——quantile()函数 147
8.3 数据格式化 148
8.3.1 设置小数位数 149
8.3.2 设置百分比 150
8.3.3 设置千位分隔符 151
8.4 小结 151
第9章 数据统计及透视表 152
视频讲解:71分钟
9.1 数据的分组统计 152
9.1.1 分组统计——groupby()函数 152
9.1.2 分组数据的迭代 154
9.1.3 分组聚合运算——agg()函数 155
9.1.4 通过字典和Series()对象进行分组统计 156
9.2 数据移位 157
9.3 数据合并 158
9.3.1 数据合并——merge()函数 158
9.3.2 数据合并——concat()函数 162
9.3.3 最近合并——merge_asof()函数 163
9.4 数据透视表 165
9.4.1 pivot()函数 165
9.4.2 pivot_table()函数 166
9.5 小结 167
第10章 处理日期与时间 168
视频讲解:94分钟
10.1 日期数据的处理 168
10.1.1 日期数据的转换 168
10.1.2 dt()对象 170
10.1.3 获取指定日期区间的数据 171
10.1.4 按不同时期统计数据 172
10.2 日期范围、频率和移位 174
10.2.1 生成日期范围——date_range()函数 174
10.2.2 日期频率转换——asfreq()函数 176
10.2.3 日期移位——shift()函数 177
10.3 时间区间与频率转换 179
10.3.1 创建时间区间 179
10.3.2 区间频率转换 180
10.4 重新采样与频率转换 181
10.4.1 重新采样——resample()函数 181
10.4.2 降采样处理 182
10.4.3 升采样处理 183
10.5 移动窗口函数 184
10.5.1 将时间序列的数据汇总——ohlc()函数 184
10.5.2 移动窗口数据计算——rolling()函数 185
10.6 小结 187
第11章 Scikit-Learn机器学习模块 188
视频讲解:54分钟
11.1 Scikit-Learn概述 188
11.2 安装Scikit-Learn模块 189
11.3 线性模型 190
11.3.1 最小二乘法回归——LinearRegression对象 190
11.3.2 岭回归——Ridge对象 191
11.4 支持向量机 192
11.5 聚类 194
11.5.1 什么是聚类 194
11.5.2 聚类算法 195
11.5.3 聚类模块 195
11.5.4 聚类数据生成器 197
11.6 小结 198
第2篇 可视化图表
第12章 Matplotlib模块入门 200
视频讲解:162分钟
12.1 Matplotlib模块概述 200
12.1.1 了解Matplotlib模块 200
12.1.2 Matplotlib模块的安装 203
12.1.3 体验Matplotlib可视化图表 204
12.2 图表的基本设置 205
12.2.1 基本绘图——plot()函数 205
12.2.2 设置画布——figure()函数 207
12.2.3 设置坐标轴——xlabel()、ylabel()函数 208
12.2.4 设置文本标签——text()函数 211
12.2.5 设置标题和图例——title()、legend()函数 212
12.2.6 添加注释——annotate()函数 215
12.2.7 设置网格线——grid()函数 217
12.2.8 设置参考线——axhline()、axvline()函数 218
12.2.9 选取范围——axhspan()、axvspan()函数 219
12.2.10 图表的布局——tight_layout()函数 220
12.2.11 保存图表——savefig()函数 221
12.3 绘制常用的图表 221
12.3.1 绘制散点图——plot()、scatter()函数 221
12.3.2 绘制折线图——plot()函数 223
12.3.3 绘制柱形图——bar()函数 224
12.3.4 绘制直方图——hist()函数 226
12.3.5 绘制饼形图——pie()函数 228
12.3.6 绘制面积图——stackplot()函数 231
12.3.7 绘制箱形图——boxplot()函数 233
12.3.8 绘制热力图——imshow()函数 236
12.3.9 绘制雷达图——polar()函数 237
12.3.10 绘制气泡图——scatter()函数 239
12.3.11 绘制棉棒图——stem()函数 239
12.3.12 绘制误差棒图——errorbar()函数 240
12.4 小结 241
第13章 Matplotlib模块进阶 242
视频讲解:69分钟
13.1 图表的颜色设置 242
13.1.1 常用颜色 242
13.1.2 可识别的颜色格式 243
13.1.3 颜色映射 244
13.2 处理日期与时间 245
13.2.1 dates子模块 245
13.2.2 设置坐标轴日期的显示格式 246
13.2.3 设置坐标轴日期刻度标签 247
13.3 次坐标轴(双坐标轴) 248
13.3.1 共享x坐标轴——twinx()函数 248
13.3.2 共享y坐标轴——twiny()函数 249
13.4 绘制多个子图表 250
13.4.1 subplot()函数 250
13.4.2 subplots()函数 252
13.4.3 add_subplot()函数 253
13.4.4 子图表共用一个坐标轴 254
13.5 绘制函数图像 255
13.5.1 一元一次函数图像 255
13.5.2 一元二次函数图像 256
13.5.3 正弦函数图像——sin()函数 256
13.5.4 余弦函数图像——cos()函数 257
13.5.5 S型生长曲线——Sigmoid()函数 257
13.6 形状与路径 258
13.6.1 绘制形状——patches子模块 258
13.6.2 绘制路径——path子模块 259
13.6.3 绘制圆——Circle()对象 261
13.6.4 绘制矩形——Rectangle()对象 262
13.7 绘制3D图表 263
13.8 小结 264
第14章 Seaborn图表 265
视频讲解:50分钟
14.1 了解Seaborn图表 265
14.1.1 Seaborn概述 265
14.1.2 安装Seaborn模块 266
14.1.3 体验Seaborn图表 267
14.2 Seaborn图表的基本设置 267
14.2.1 设置背景风格 267
14.2.2 控制边框的显示方式 268
14.3 绘制常见图表 268
14.3.1 绘制散点图——replot()函数 268
14.3.2 绘制折线图——relplot()、lineplot()函数 269
14.3.3 绘制直方图——displot()函数 271
14.3.4 绘制条形图——barplot()函数 271
14.3.5 绘制线性回归模型——lmplot()函数 272
14.3.6 绘制箱形图——boxplot()函数 273
14.3.7 绘制核密度图——kdeplot()函数 274
14.3.8 绘制提琴图——violinplot()函数 275
14.4 小结 275
第15章 Plotly图表 276
视频讲解:57分钟
15.1 了解Plotly图表 276
15.1.1 安装Plotly模块 276
15.1.2 Plotly绘图原理及流程 277
15.1.3 Plotly图表的生成方法 278
15.2 绘制基础图表 280
15.2.1 绘制散点图与折线图——Scatter()对象 280
15.2.2 绘制柱形图与水平条形图——Bar()对象 281
15.2.3 绘制饼图与环形图——Pie()对象 283
15.3 设置图表 285
15.3.1 图层布局——Layout()对象 285
15.3.2 设置图表标题 286
15.3.3 设置文本标记 286
15.3.4 设置注释文本 287
15.4 统计图表 290
15.4.1 绘制直方图 290
15.4.2 绘制箱形图 291
15.4.3 绘制热力图 292
15.4.4 绘制等高线图 293
15.5 绘制子图表 294
15.5.1 绘制基本的子图表 294
15.5.2 自定义子图位置 295
15.5.3 子图可供选择的图形类型 296
15.6 三维图绘制 296
15.7 绘制表格 297
15.7.1 Table()对象 297
15.7.2 create_table()函数 299
15.8 小结 301
第16章 Bokeh图表 302
视频讲解:51分钟
16.1 了解Bokeh图表 302
16.1.1 安装Bokeh模块 302
16.1.2 词汇与接口说明 302
16.1.3 绘制第一张Bokeh图表 303
16.1.4 通过数据类型绘制图表 305
16.2 绘制常见图表 309
16.2.1 绘制散点图——circle()函数 309
16.2.2 绘制组合图表——line()、circle()函数 310
16.2.3 绘制条形图——vbar()函数 311
16.2.4 绘制饼(环)形图——wedge()、annular_wedge()函数 312
16.3 设置图表 313
16.3.1 图表布局——column()、row()、gridplot()函数 313
16.3.2 配置绘图工具 315
16.3.3 设置视觉属性 317
16.3.4 图表注释 319
16.4 图表可视化交互 323
16.4.1 微调器 323
16.4.2 选项卡 324
16.4.3 滑块功能 325
16.5 小结 326
第17章 Pyecharts图表 327
视频讲解:52分钟
17.1 了解Pyecharts图表 327
17.1.1 Pyecharts概述 327
17.1.2 安装Pyecharts模块 328
17.1.3 绘制第一张Pyecharts图表 329
17.1.4 Pyecharts函数的链式调用 329
17.2 Pyecharts图表的组成部分 330
17.2.1 主题风格——InitOpts()对象 331
17.2.2 图表标题——TitleOpts()对象 332
17.2.3 图例——LegendOpts()对象 334
17.2.4 提示框——TooltipOpts()对象 336
17.2.5 视觉映射——VisualMapOpts()对象 337
17.2.6 工具箱——ToolboxOpts()对象 339
17.2.7 区域缩放——DataZoomOpts()对象 341
17.3 绘制Pyecharts图表 342
17.3.1 绘制散点图——EffectScatter()对象 342
17.3.2 绘制折线图和面积图——Line()对象 343
17.3.3 绘制柱形图——Bar()对象 345
17.3.4 绘制饼形图——Pie()对象 346
17.3.5 绘制箱形图——Boxplot()对象 348
17.3.6 绘制词云图——WordCloud对象 349
17.3.7 绘制热力图——HeatMap()对象 350
17.3.8 绘制水球图——Liquid()对象 352
17.3.9 绘制日历图——Calendar()对象 352
17.4 小结 353
第3篇 项目实战
第18章 综合案例:股票数据分析 356
视频讲解:44分钟
18.1 概述 356
18.2 案例效果预览 356
18.3 案例环境 358
18.4 前期准备 359
18.4.1 安装第三方模块 359
18.4.2 新建Jupyter Notebook文件 359
18.4.3 导入必要的模块 361
18.4.4 获取股票历史数据 361
18.5 数据预处理 362
18.5.1 数据查看与缺失性分析 362
18.5.2 描述性统计分析 363
18.5.3 数据处理 364
18.5.4 异常值分析 364
18.5.5 数据归一化处理 365
18.6 数据统计分析 365
18.6.1 可视化股票走势图 365
18.6.2 股票收盘价格走势图 366
18.6.3 股票成交量时间序列图 367
18.6.4 股票涨跌情况分析图 367
18.6.5 股票k线走势图 368
第19章 综合案例:淘宝网订单分析 370
视频讲解:5分钟
19.1 概述 370
19.2 案例效果预览 371
19.3 案例环境 372
19.4 数据集介绍 372
19.5 前期准备 373
19.5.1 安装第三方模块 373
19.5.2 新建Jupyter Notebook文件 373
19.5.3 导入必要的模块 373
19.5.4 数据读取与查看 374
19.6 数据预处理 375
19.6.1 缺失性分析 375
19.6.2 描述性统计分析 375
19.6.3 数据处理 376
19.7 数据统计分析 377
19.7.1 整体情况分析 377
19.7.2 按订单类型分析订单量 377
19.7.3 按区域分析订单量 378
19.7.4 每日订单量分析 380
19.7.5 小时订单量分析 380
第20章 综合案例:网站用户数据分析 382
视频讲解:32分钟
20.1 概述 382
20.2 案例效果预览 382
20.3 案例环境 383
20.4 MySQL数据 383
20.4.1 导入MySQL数据 383
20.4.2 Python连接MySQL数据库 384
20.5 实现过程 385
20.5.1 数据准备 385
20.5.2 数据检测 385
20.5.3 年度注册用户分析 385
20.5.4 新注册用户分析 387
第21章 综合案例:NBA球员薪资的数据分析 389
视频讲解:4分钟
21.1 概述 389
21.2 案例效果预览 389
21.3 案例环境 391
21.4 实现过程 391
21.4.1 数据准备 391
21.4.2 确定网页格式 392
21.4.3 Pandas爬取数据并保存 393
21.4.4 数据清洗 394
21.4.5 水平柱形图分析湖人队薪资状况 394
21.4.6 统计分析各个球队队员薪资总和 395
21.4.7 统计分析多个球队所有球员的薪资状况 397
21.4.8 分析不同位置球员的薪资状况 398
第1章 数据分析基础 2
视频讲解:27分钟
1.1 数据分析概述 2
1.2 常见数据分析方法 3
1.2.1 对比分析法 3
1.2.2 同比分析法 4
1.2.3 环比分析法 4
1.2.4 回归分析法 5
1.2.5 聚类分析法 6
1.3 了解数据分析工具 6
1.4 数据分析的基本流程 7
1.4.1 确认目标 7
1.4.2 获取数据 8
1.4.3 处理数据 9
1.4.4 分析数据 10
1.4.5 验证结果 10
1.4.6 展示数据 10
1.4.7 应用数据 11
1.5 数据分析常用模块库 11
1.6 小结 12
第2章 搭建数据分析开发环境 13
视频讲解:19分钟
2.1 强大的编程语言Python 13
2.1.1 Python概述 13
2.1.2 安装Python 13
2.1.3 创建第一个Python程序 17
2.2 安装Anaconda开发环境 18
2.3 Jupyter Notebook开发工具 23
2.3.1 初识Jupyter Notebook 23
2.3.2 创建Jupyter Notebook文件 24
2.3.3 测试Jupyter Notebook 24
2.4 PyCharm集成开发环境 26
2.4.1 PyCharm的下载与安装 26
2.4.2 配置PyCharm 29
2.4.3 测试PyCharm 30
2.5 小结 32
第3章 NumPy模块之数组计算 33
视频讲解:265分钟
3.1 NumPy模块概述 33
3.1.1 什么是NumPy模块 33
3.1.2 安装NumPy模块 34
3.1.3 NumPy的数据类型 35
3.1.4 ndarray()数组对象 36
3.1.5 dtype数据类型对象 37
3.2 创建数组 37
3.2.1 创建简单的数组 38
3.2.2 多种创建数组的方式 39
3.2.3 根据数值范围创建数组 41
3.2.4 生成随机数组 43
3.2.5 在已有的数组中创建数组 45
3.3 数组的基本操作 49
3.3.1 数组的多种运算方式 49
3.3.2 数组的索引和切片 51
3.3.3 数组的重塑 55
3.3.4 数组的增、删、改、查 57
3.4 矩阵的基本操作 59
3.4.1 创建矩阵 60
3.4.2 矩阵的运算 62
3.4.3 矩阵的转换 64
3.5 NumPy常用的数学运算函数 65
3.5.1 算术函数 66
3.5.2 舍入函数 67
3.5.3 三角函数 68
3.6 统计分析 69
3.6.1 求和函数sum() 70
3.6.2 平均值函数mean() 70
3.6.3 最大值与最小值函数max()、min() 71
3.6.4 中位数函数median() 71
3.6.5 加权平均函数average() 72
3.6.6 方差与标准差函数var()、std() 73
3.7 数组排序 73
3.7.1 sort()函数 73
3.7.2 argsort()函数 74
3.7.3 lexsort()函数 74
3.8 小结 75
第4章 Pandas模块基础 76
视频讲解:67分钟
4.1 安装Pandas模块 76
4.2 了解Pandas模块 78
4.3 Pandas模块的两大数据结构 79
4.3.1 Series()对象 79
4.3.2 DataFrame()对象 80
4.4 数据中的索引 82
4.4.1 什么是索引 82
4.4.2 Series()对象的索引 83
4.4.3 DataFrame()对象的索引 86
4.5 小结 88
第5章 Pandas模块之数据的读取 89
视频讲解:75分钟
5.1 读取文本文件中的数据 89
5.2 Excel文件的读取和写入 90
5.2.1 读取Excel文件中的数据 90
5.2.2 读取指定Sheet页中的数据 93
5.2.3 通过行列索引读取指定数据 93
5.2.4 将数据写入Excel文件中 95
5.3 CSV文件的读取和写入 96
5.3.1 读取CSV文件中的数据 96
5.3.2 将数据写入CSV文件中 98
5.4 读取HTML网页 99
5.5 读取数据库中的数据 101
5.5.1 读取MySQL数据库中的数据 101
5.5.2 读取MongoDB数据库中的数据 104
5.6 小结 108
第6章 Pandas模块之数据的处理 109
视频讲解:96分钟
6.1 数据抽取 109
6.1.1 抽取指定行数据 110
6.1.2 抽取多行数据 110
6.1.3 抽取指定列数据 111
6.1.4 抽取指定的行、列数据 112
6.2 数据的增、删、改、查 113
6.2.1 增加数据 113
6.2.2 按行增加数据 114
6.2.3 删除数据 115
6.2.4 修改数据 116
6.2.5 查询数据 117
6.3 数据的排序和排名 120
6.3.1 数据的排序 120
6.3.2 数据排名 123
6.4 小结 125
第7章 Pandas模块之数据的清洗 126
视频讲解:81分钟
7.1 缺失值的处理 126
7.1.1 了解数据中的缺失值 126
7.1.2 查看缺失值 127
7.1.3 处理缺失值 128
7.2 处理数据中的重复值 129
7.3 数据中异常值的检测与处理 130
7.4 数据中字符串的操作函数 131
7.4.1 字符串对象中的常见函数 131
7.4.2 替换字符串——replace()函数 133
7.4.3 数据切分——split()函数 134
7.4.4 判断字符串——contains()函数 135
7.5 数据转换 136
7.5.1 通过字典映射的方式实现数据转换——map()函数 136
7.5.2 数据分割——cut()函数 137
7.5.3 数据分类——get_dummies()函数 138
7.6 小结 139
第8章 数据的计算与格式化 140
视频讲解:54分钟
8.1 常见的数据计算函数 140
8.1.1 求和——sum()函数 140
8.1.2 求平均值——mean()函数 141
8.1.3 求最大值——max()函数 142
8.1.4 求最小值——min()函数 143
8.2 高级的数据计算函数 144
8.2.1 求取中位数——median()函数 144
8.2.2 求取众数——mode()函数 145
8.2.3 计算方差——var()函数 146
8.2.4 计算标准差——std()函数 147
8.2.5 计算分位数——quantile()函数 147
8.3 数据格式化 148
8.3.1 设置小数位数 149
8.3.2 设置百分比 150
8.3.3 设置千位分隔符 151
8.4 小结 151
第9章 数据统计及透视表 152
视频讲解:71分钟
9.1 数据的分组统计 152
9.1.1 分组统计——groupby()函数 152
9.1.2 分组数据的迭代 154
9.1.3 分组聚合运算——agg()函数 155
9.1.4 通过字典和Series()对象进行分组统计 156
9.2 数据移位 157
9.3 数据合并 158
9.3.1 数据合并——merge()函数 158
9.3.2 数据合并——concat()函数 162
9.3.3 最近合并——merge_asof()函数 163
9.4 数据透视表 165
9.4.1 pivot()函数 165
9.4.2 pivot_table()函数 166
9.5 小结 167
第10章 处理日期与时间 168
视频讲解:94分钟
10.1 日期数据的处理 168
10.1.1 日期数据的转换 168
10.1.2 dt()对象 170
10.1.3 获取指定日期区间的数据 171
10.1.4 按不同时期统计数据 172
10.2 日期范围、频率和移位 174
10.2.1 生成日期范围——date_range()函数 174
10.2.2 日期频率转换——asfreq()函数 176
10.2.3 日期移位——shift()函数 177
10.3 时间区间与频率转换 179
10.3.1 创建时间区间 179
10.3.2 区间频率转换 180
10.4 重新采样与频率转换 181
10.4.1 重新采样——resample()函数 181
10.4.2 降采样处理 182
10.4.3 升采样处理 183
10.5 移动窗口函数 184
10.5.1 将时间序列的数据汇总——ohlc()函数 184
10.5.2 移动窗口数据计算——rolling()函数 185
10.6 小结 187
第11章 Scikit-Learn机器学习模块 188
视频讲解:54分钟
11.1 Scikit-Learn概述 188
11.2 安装Scikit-Learn模块 189
11.3 线性模型 190
11.3.1 最小二乘法回归——LinearRegression对象 190
11.3.2 岭回归——Ridge对象 191
11.4 支持向量机 192
11.5 聚类 194
11.5.1 什么是聚类 194
11.5.2 聚类算法 195
11.5.3 聚类模块 195
11.5.4 聚类数据生成器 197
11.6 小结 198
第2篇 可视化图表
第12章 Matplotlib模块入门 200
视频讲解:162分钟
12.1 Matplotlib模块概述 200
12.1.1 了解Matplotlib模块 200
12.1.2 Matplotlib模块的安装 203
12.1.3 体验Matplotlib可视化图表 204
12.2 图表的基本设置 205
12.2.1 基本绘图——plot()函数 205
12.2.2 设置画布——figure()函数 207
12.2.3 设置坐标轴——xlabel()、ylabel()函数 208
12.2.4 设置文本标签——text()函数 211
12.2.5 设置标题和图例——title()、legend()函数 212
12.2.6 添加注释——annotate()函数 215
12.2.7 设置网格线——grid()函数 217
12.2.8 设置参考线——axhline()、axvline()函数 218
12.2.9 选取范围——axhspan()、axvspan()函数 219
12.2.10 图表的布局——tight_layout()函数 220
12.2.11 保存图表——savefig()函数 221
12.3 绘制常用的图表 221
12.3.1 绘制散点图——plot()、scatter()函数 221
12.3.2 绘制折线图——plot()函数 223
12.3.3 绘制柱形图——bar()函数 224
12.3.4 绘制直方图——hist()函数 226
12.3.5 绘制饼形图——pie()函数 228
12.3.6 绘制面积图——stackplot()函数 231
12.3.7 绘制箱形图——boxplot()函数 233
12.3.8 绘制热力图——imshow()函数 236
12.3.9 绘制雷达图——polar()函数 237
12.3.10 绘制气泡图——scatter()函数 239
12.3.11 绘制棉棒图——stem()函数 239
12.3.12 绘制误差棒图——errorbar()函数 240
12.4 小结 241
第13章 Matplotlib模块进阶 242
视频讲解:69分钟
13.1 图表的颜色设置 242
13.1.1 常用颜色 242
13.1.2 可识别的颜色格式 243
13.1.3 颜色映射 244
13.2 处理日期与时间 245
13.2.1 dates子模块 245
13.2.2 设置坐标轴日期的显示格式 246
13.2.3 设置坐标轴日期刻度标签 247
13.3 次坐标轴(双坐标轴) 248
13.3.1 共享x坐标轴——twinx()函数 248
13.3.2 共享y坐标轴——twiny()函数 249
13.4 绘制多个子图表 250
13.4.1 subplot()函数 250
13.4.2 subplots()函数 252
13.4.3 add_subplot()函数 253
13.4.4 子图表共用一个坐标轴 254
13.5 绘制函数图像 255
13.5.1 一元一次函数图像 255
13.5.2 一元二次函数图像 256
13.5.3 正弦函数图像——sin()函数 256
13.5.4 余弦函数图像——cos()函数 257
13.5.5 S型生长曲线——Sigmoid()函数 257
13.6 形状与路径 258
13.6.1 绘制形状——patches子模块 258
13.6.2 绘制路径——path子模块 259
13.6.3 绘制圆——Circle()对象 261
13.6.4 绘制矩形——Rectangle()对象 262
13.7 绘制3D图表 263
13.8 小结 264
第14章 Seaborn图表 265
视频讲解:50分钟
14.1 了解Seaborn图表 265
14.1.1 Seaborn概述 265
14.1.2 安装Seaborn模块 266
14.1.3 体验Seaborn图表 267
14.2 Seaborn图表的基本设置 267
14.2.1 设置背景风格 267
14.2.2 控制边框的显示方式 268
14.3 绘制常见图表 268
14.3.1 绘制散点图——replot()函数 268
14.3.2 绘制折线图——relplot()、lineplot()函数 269
14.3.3 绘制直方图——displot()函数 271
14.3.4 绘制条形图——barplot()函数 271
14.3.5 绘制线性回归模型——lmplot()函数 272
14.3.6 绘制箱形图——boxplot()函数 273
14.3.7 绘制核密度图——kdeplot()函数 274
14.3.8 绘制提琴图——violinplot()函数 275
14.4 小结 275
第15章 Plotly图表 276
视频讲解:57分钟
15.1 了解Plotly图表 276
15.1.1 安装Plotly模块 276
15.1.2 Plotly绘图原理及流程 277
15.1.3 Plotly图表的生成方法 278
15.2 绘制基础图表 280
15.2.1 绘制散点图与折线图——Scatter()对象 280
15.2.2 绘制柱形图与水平条形图——Bar()对象 281
15.2.3 绘制饼图与环形图——Pie()对象 283
15.3 设置图表 285
15.3.1 图层布局——Layout()对象 285
15.3.2 设置图表标题 286
15.3.3 设置文本标记 286
15.3.4 设置注释文本 287
15.4 统计图表 290
15.4.1 绘制直方图 290
15.4.2 绘制箱形图 291
15.4.3 绘制热力图 292
15.4.4 绘制等高线图 293
15.5 绘制子图表 294
15.5.1 绘制基本的子图表 294
15.5.2 自定义子图位置 295
15.5.3 子图可供选择的图形类型 296
15.6 三维图绘制 296
15.7 绘制表格 297
15.7.1 Table()对象 297
15.7.2 create_table()函数 299
15.8 小结 301
第16章 Bokeh图表 302
视频讲解:51分钟
16.1 了解Bokeh图表 302
16.1.1 安装Bokeh模块 302
16.1.2 词汇与接口说明 302
16.1.3 绘制第一张Bokeh图表 303
16.1.4 通过数据类型绘制图表 305
16.2 绘制常见图表 309
16.2.1 绘制散点图——circle()函数 309
16.2.2 绘制组合图表——line()、circle()函数 310
16.2.3 绘制条形图——vbar()函数 311
16.2.4 绘制饼(环)形图——wedge()、annular_wedge()函数 312
16.3 设置图表 313
16.3.1 图表布局——column()、row()、gridplot()函数 313
16.3.2 配置绘图工具 315
16.3.3 设置视觉属性 317
16.3.4 图表注释 319
16.4 图表可视化交互 323
16.4.1 微调器 323
16.4.2 选项卡 324
16.4.3 滑块功能 325
16.5 小结 326
第17章 Pyecharts图表 327
视频讲解:52分钟
17.1 了解Pyecharts图表 327
17.1.1 Pyecharts概述 327
17.1.2 安装Pyecharts模块 328
17.1.3 绘制第一张Pyecharts图表 329
17.1.4 Pyecharts函数的链式调用 329
17.2 Pyecharts图表的组成部分 330
17.2.1 主题风格——InitOpts()对象 331
17.2.2 图表标题——TitleOpts()对象 332
17.2.3 图例——LegendOpts()对象 334
17.2.4 提示框——TooltipOpts()对象 336
17.2.5 视觉映射——VisualMapOpts()对象 337
17.2.6 工具箱——ToolboxOpts()对象 339
17.2.7 区域缩放——DataZoomOpts()对象 341
17.3 绘制Pyecharts图表 342
17.3.1 绘制散点图——EffectScatter()对象 342
17.3.2 绘制折线图和面积图——Line()对象 343
17.3.3 绘制柱形图——Bar()对象 345
17.3.4 绘制饼形图——Pie()对象 346
17.3.5 绘制箱形图——Boxplot()对象 348
17.3.6 绘制词云图——WordCloud对象 349
17.3.7 绘制热力图——HeatMap()对象 350
17.3.8 绘制水球图——Liquid()对象 352
17.3.9 绘制日历图——Calendar()对象 352
17.4 小结 353
第3篇 项目实战
第18章 综合案例:股票数据分析 356
视频讲解:44分钟
18.1 概述 356
18.2 案例效果预览 356
18.3 案例环境 358
18.4 前期准备 359
18.4.1 安装第三方模块 359
18.4.2 新建Jupyter Notebook文件 359
18.4.3 导入必要的模块 361
18.4.4 获取股票历史数据 361
18.5 数据预处理 362
18.5.1 数据查看与缺失性分析 362
18.5.2 描述性统计分析 363
18.5.3 数据处理 364
18.5.4 异常值分析 364
18.5.5 数据归一化处理 365
18.6 数据统计分析 365
18.6.1 可视化股票走势图 365
18.6.2 股票收盘价格走势图 366
18.6.3 股票成交量时间序列图 367
18.6.4 股票涨跌情况分析图 367
18.6.5 股票k线走势图 368
第19章 综合案例:淘宝网订单分析 370
视频讲解:5分钟
19.1 概述 370
19.2 案例效果预览 371
19.3 案例环境 372
19.4 数据集介绍 372
19.5 前期准备 373
19.5.1 安装第三方模块 373
19.5.2 新建Jupyter Notebook文件 373
19.5.3 导入必要的模块 373
19.5.4 数据读取与查看 374
19.6 数据预处理 375
19.6.1 缺失性分析 375
19.6.2 描述性统计分析 375
19.6.3 数据处理 376
19.7 数据统计分析 377
19.7.1 整体情况分析 377
19.7.2 按订单类型分析订单量 377
19.7.3 按区域分析订单量 378
19.7.4 每日订单量分析 380
19.7.5 小时订单量分析 380
第20章 综合案例:网站用户数据分析 382
视频讲解:32分钟
20.1 概述 382
20.2 案例效果预览 382
20.3 案例环境 383
20.4 MySQL数据 383
20.4.1 导入MySQL数据 383
20.4.2 Python连接MySQL数据库 384
20.5 实现过程 385
20.5.1 数据准备 385
20.5.2 数据检测 385
20.5.3 年度注册用户分析 385
20.5.4 新注册用户分析 387
第21章 综合案例:NBA球员薪资的数据分析 389
视频讲解:4分钟
21.1 概述 389
21.2 案例效果预览 389
21.3 案例环境 391
21.4 实现过程 391
21.4.1 数据准备 391
21.4.2 确定网页格式 392
21.4.3 Pandas爬取数据并保存 393
21.4.4 数据清洗 394
21.4.5 水平柱形图分析湖人队薪资状况 394
21.4.6 统计分析各个球队队员薪资总和 395
21.4.7 统计分析多个球队所有球员的薪资状况 397
21.4.8 分析不同位置球员的薪资状况 398
猜您喜欢