书籍详情

交互的Python 数据分析入门

交互的Python 数据分析入门

作者:王诗翔

出版社:人民邮电出版社

出版时间:2020-07-01

ISBN:9787115535702

定价:¥79.00

购买这本书可以去
内容简介
  Python具有强大的应用能力,以及便捷高效的数据分析和可视化扩展包系统。本书重点讲解Python数据分析的基础知识,使读者通过Python理解数据分析的逻辑,并掌握基本的Python编程知识和分析实现方法。本书系统全面、循序渐进地介绍了Python编程基础、数据导入、数据分析和可视化内容,包括条件判断与循环控制、从Excel中导入数据、使用Pandas库进行数据的转换和计算,以及使用Plotnine库绘制ggplot风格的图形等。此外,本书还涉及Markdown、基本的统计理论和IPython魔术命令等内容。
作者简介
  王诗翔,本科毕业于电子科技大学,获工学学士学位,优秀毕业论文获得者。目前在上海科技大学深造,攻读博士学位。主要工作是利用公开发表的数据集和数据库研究和分析癌症基因组学数据,挖掘有临床应用价值的生物标志物。
目录
第 1章 Python介绍及学习前的准备 1
1.1 Python是什么 1
1.2 为什么要使用Python进行数据分析 2
1.3 科学计算核心库简介 2
1.4 搭建环境 3
1.4.1 线上平台 3
1.4.2 本地机器环境下相关软件的安装 4
1.5 章末小结 12
第 2章 Python入门示例及基础知识 13
2.1 Python解释器与IPython 13
2.1.1 标准Python解释器 13
2.1.2 IPython 14
2.2 Python入门示例 15
2.3 nteract软件使用简介 16
2.4 算术运算 17
2.4.1 简单数学运算 17
2.4.2 代码约定 18
2.4.3 计算身体质量指数 19
2.5 变量简介 20
2.5.1 什么是变量 20
2.5.2 变量的命名 21
2.6 基本数据类型 22
2.6.1 数字 22
2.6.2 字符串 23
2.6.3 布尔值 24
2.6.4 查看数据类型 24
2.7 数据运算 25
2.7.1 加号与黑箱子 25
2.7.2 类型转换 26
2.7.3 运算符汇总 26
2.8 章末小结 27
第3章 基本数据结构 28
3.1 列表 28
3.1.1 列表的创建 28
3.1.2 修改列表元素 30
3.1.3 遍历列表 30
3.1.4 列表操作符 31
3.1.5 列表切片 32
3.1.6 列表方法、函数与操作 33
3.1.7 列表与字符串 37
3.1.8 列表对象与值 38
3.2 元组 39
3.2.1 元组的创建 40
3.2.2 元组操作 40
3.2.3 元组与列表的区别 42
3.3 字典 42
3.3.1 字典的创建与使用 42
3.3.2 字典操作 43
3.4 集合 45
3.4.1 集合的创建 45
3.4.2 集合操作 45
3.4.3 冰冻集 46
3.5 章末小结 47
第4章 控制流与文件操作 48
4.1 条件结构if-else 48
4.1.1 简单if-else结构 49
4.1.2 嵌套条件结构 50
4.1.3 单行if-else 51
4.1.4 使用逻辑操作符 51
4.2 for语句 52
4.2.1 for语句块 53
4.2.2 else语句块 53
4.2.3 索引迭代 54
4.2.4 多列表迭代 55
4.2.5 列表推导式 55
4.2.6 条件列表推导式 57
4.2.7 字典迭代 58
4.3 while语句 59
4.4 continue、break与pass 61
4.4.1 continue 61
4.4.2 break 62
4.4.3 pass 64
4.5 文件操作 64
4.5.1 文件类型 65
4.5.2 使用open()函数读取文件 65
4.5.3 使用open()写文件 68
4.6 章末小结 68
第5章 函数与模块 69
5.1 函数 69
5.1.1 为什么使用函数 69
5.1.2 函数的调用 70
5.1.3 函数的创建 71
5.1.4 函数作用域 72
5.1.5 递归函数 73
5.2 函数的参数 76
5.2.1 位置参数 76
5.2.2 关键字参数 77
5.2.3 可变参数 79
5.3 模块 80
5.3.1 模块与包结构 80
5.3.2 模块的创建 81
5.3.3 模块的作用域 83
5.3.4 三方模块的安装 83
5.3.5 模块的使用 85
5.4 章末小结 87
第6章 NumPy 88
6.1 NumPy简介与ndarray 88
6.1.1 NumPy简介 88
6.1.2 创建ndarray 89
6.2 数组操作 92
6.2.1 数组运算 92
6.2.2 索引与切片 95
6.2.3 布尔型索引 99
6.2.4 数组转置与轴转换 101
6.3 数组函数与方法 103
6.3.1 通用函数 103
6.3.2 基本统计 105
6.3.3 排序与集合操作 107
6.3.4 线性代数操作 108
6.3.5 伪随机数的生成 109
6.3.6 数组文件的输入与导出 111
6.4 章末小结 112
第7章 Matplotlib 113
7.1 Matplotlib入门 113
7.1.1 Matplotlib库简介 113
7.1.2 命名约定 114
7.1.3 如何展示图形 114
7.1.4 保存图形 116
7.1.5 两种绘图接口 117
7.2 基本图形绘制 119
7.2.1 线图 119
7.2.2 散点图 132
7.2.3 条形图 137
7.2.4 直方图 142
7.2.5 饼图 146
7.2.6 箱线图 148
7.3 多图与自定义 150
7.3.1 多图 150
7.3.2 设置风格 154
7.3.3 两种接口映射 156
7.4 章末小结 157
第8章 Pandas入门 158
8.1 Pandas简介 158
8.2 Pandas的数据结构 159
8.2.1 Series 159
8.2.2 DataFrame 161
8.3 Pandas对象基本操作 163
8.3.1 查看数据 164
8.3.2 转置 165
8.3.3 重索引 165
8.3.4 删除数据 168
8.3.5 重赋值 169
8.3.6 索引与过滤 169
8.3.7 算术运算 174
8.3.8 函数应用 176
8.3.9 排序 177
8.4 基本统计分析 179
8.5 章末小结 180
第9章 Markdown基础 181
9.1 Markdown简介 181
9.2 Markdown语法 182
9.2.1 块元素 182
9.2.2 内联元素 188
9.3 联合Python与Markdown 191
9.3.1 代码块与文本块 191
9.3.2 文档范例 192
9.4 章末小结 195
第 10章 数据导入 196
10.1 CSV文件 196
10.1.1 使用字符串方法 197
10.1.2 使用csv标准模块 197
10.1.3 使用Pandas库 198
10.2 CSV变体 198
10.2.1 创建CSV导入函数 199
10.2.2 使用Pandas导入 200
10.2.3 导出CSV 202
10.3 Excel文件 203
10.3.1 检查数据 203
10.3.2 准备工作 204
10.3.3 使用Pandas读写Excel 205
10.4 pickle文件 207
10.5 SAS与Stata文件 208
10.6 HDF5文件 209
10.7 MATLAB文件 210
10.8 json文件 211
10.9 YAML文件 213
10.10 网页数据 215
10.11 数据库数据 218
10.12 章末小结 220
第 11章 数据分析工具箱 221
11.1 辅助函数与工具 221
11.1.1 序列解包 221
11.1.2 断言 222
11.1.3 常用的字符串方法 223
11.2 作用域与求值计算 223
11.2.1 作用域 223
11.2.2 使用exec()和eval()执行计算 224
11.3 异常的捕获和处理 225
11.3.1 捕获异常 225
11.3.2 产生异常 227
11.4 函数式编程 227
11.4.1 高阶函数 227
11.4.2 常用的高阶函数 228
11.4.3 itertools模块 229
11.5 生成器与装饰器 230
11.5.1 生成器 230
11.5.2 利用生成器读入大型数据集 232
11.5.3 装饰器 232
11.6 正则表达式 233
11.7 章末小结 236
第 12章 Pandas进阶 237
12.1 深入Pandas数据结构 237
12.1.1 回顾 237
12.1.2 分类变量 239
12.1.3 时间序列 243
12.2 迭代与函数应用 247
12.2.1 迭代 247
12.2.2 函数应用 250
12.2.3 字符串函数 253
12.2.4 分组计算 256
12.3 数据清洗 256
12.3.1 缺失值处理 257
12.3.2 连接 259
12.3.3 级联 262
12.4 Pandas可视化 265
12.4.1 条形图 266
12.4.2 直方图 268
12.4.3 箱线图 269
12.4.4 面积图 270
12.4.5 散点图 271
12.4.6 饼图 271
12.5 章末小结 272
第 13章 数据可视化进阶 273
13.1 Seaborn 273
13.1.1 成对图 274
13.1.2 子集图 279
13.1.3 回归图 280
13.1.4 核密度图 281
13.1.5 条形图 282
13.1.6 计数图 284
13.1.7 点图 284
13.1.8 箱线图 285
13.1.9 小提琴图 286
13.1.10 双变量分布图 286
13.2 Plotnine 288
13.2.1 ggplot 术语 290
13.2.2 ggplot 初探 290
13.2.3 常见的几何函数和选项 298
13.3 Bokeh 299
13.3.1 Bokeh 基础 299
13.3.2 图形排列 303
13.4 章末小结 305
第 14章 统计分析 306
14.1 概括性度量 306
14.1.1 集中趋势的度量 307
14.1.2 离散程度的度量 308
14.1.3 偏态与峰态的度量 309
14.2 统计分布 311
14.2.1 正态分布 311
14.2.2 二项分布 312
14.2.3 伯努利分布 314
14.2.4 指数分布 314
14.2.5 泊松分布 315
14.3 假设检验 316
14.3.1 u 与 t 统计量 316
14.3.2 一个 t 检验实例 317
14.3.3 两样本 t 检验 317
14.4 章末小结 318
第 15章 未言及的内容 319
15.1 魔术命令 319
15.2 面向对象编程 321
15.3 章末小结 323
结语:接下来学什么 324
猜您喜欢

读书导航