书籍详情
Python数据分析
作者:吴道君,朱家荣 著
出版社:中国铁道出版社
出版时间:2019-09-01
ISBN:9787113258719
定价:¥45.00
购买这本书可以去
内容简介
本书全面讲解Python数据分析的相关知识和技术,内容包括Python数据分析概述、NumPy数值计算、Matplotlib数据可视化、Pandas数据分析、数据预处理、Sklearn机器学习。本书以培养学生编程能力和数据分析能力为目标,注重技术应用能力的培养。 本书内容充实、结构合理、实用性强,具有明确的应用能力培养目标,易于接受和理解,学完本书后,可以具备数据分析的基本能力。 本书适合作为普通高等院校人工智能、数据科学与大数据以及计算机相关专业课程的教材,也可以作为相关从业人员的技术参考用书。
作者简介
吴道君,男,广东岭南职业技术学院讲师、高级软件工程师,承担编程基础C++、软件工程、J2EE编程开发、.net开发等多门课程的教学任务。2011年12月指导学生参加第二届“国信蓝点杯”全国软件专业人才设计与开发大赛并获得个人赛全国总决赛“二等奖”,2013年在广东省首届信息技术类专业带头人“说专业”竞赛中获得“二等奖”。主编2016年9月于我社出版的《Java程序设计》一书。朱家荣:本科,就职于广西师范大学,从事数学、计算机等学科的课程教学,近10年主要担任《现代教育技术》、《教育技术与多媒体课件制作(含微课制作)》、《计算机应用基础》等课程教学。主持(或主要参与)完成广西教育厅科研项目,广西教育厅新世纪教改革工程项目等10多项,发表学术论文20多篇、主编参编教材多部,参与的《竞赛驱动 双向融通 地方高师院校师范生教师职业能力提升的研究与实践》项目获2017年广西高等教育自治区级教学成果奖一等奖。
目录
第1章 Python数据分析概述 1
1.1 数据分析的概念、流程和应用 1
1.1.1 数据分析的概念 1
1.1.2 数据分析的流程 2
1.1.3 数据分析的应用 2
1.2 数据分析工具 3
1.2.1 常用工具 4
1.2.2 Python数据分析 4
1.3 Python数据分析环境 5
小结 9
习题 9
实验 10
第2章 NumPy数值计算 15
2.1 NumPy多维数组 15
2.1.1 数组创建 15
2.1.2 数组对象属性 22
2.1.3 数组数据类型 23
2.2 数组操作 24
2.2.1 修改数组形状 24
2.2.2 翻转数组 26
2.2.3 连接数组 27
2.2.4 分割数组 28
2.2.5 数组元素添加与删除 30
2.3 数组索引与切片 32
2.3.1 数组索引 32
2.3.2 数组切片 33
2.3.3 布尔型索引 34
2.3.4 花式索引 35
2.4 数组的运算 35
2.4.1 数组和标量间的运算 35
2.4.2 广播 36
2.4.3 算术函数 37
2.4.4 集合运算 40
2.4.5 统计运算 41
2.4.6 排序 43
2.4.7 搜索 44
2.5 线性代数 45
2.5.1 数组相乘 46
2.5.2 矩阵行列式 46
2.5.3 逆矩阵 46
2.5.4 线性方程组 47
2.5.5 特征值和特征向量 47
2.6 数组的存取 48
小结 48
习题 48
实验 51
第3章 Matplotlib数据可视化 54
3.1 线形图 54
3.1.1 绘制线形图 54
3.1.2 颜色设置 55
3.1.3 线型设置 56
3.1.4 坐标点设置 57
3.1.5 线宽设置 59
3.2 其他图形 59
3.2.1 散点图 59
3.2.2 柱形图 61
3.2.3 条形图 63
3.2.4 饼图 64
3.2.5 直方图 65
3.2.6 箱线图 67
3.3 自定义设置 69
3.3.1 图例设置 69
3.3.2 坐标网格设置 70
3.3.3 坐标系设置 71
3.3.4 样式设置与注解 72
3.3.5 RC设置 73
3.4 子图 74
3.4.1 创建子图 74
3.4.2 子图坐标系设置 76
3.4.3 图形嵌套 77
3.5 绘制三维图形 78
小结 81
习题 82
实验 82
第4章 Pandas数据分析 89
4.1 Pandas数据结构 89
4.2 DataFrame基本功能 94
4.3 读取外部数据 95
4.3.1 CSV文件 96
4.3.2 Sqlite数据库 98
4.4 数据帧的列操作和行操作 99
4.4.1 列操作 99
4.4.2 行操作 101
4.5 高级索引 103
4.5.1 重建索引 103
4.5.2 更换索引 106
4.5.3 层次化索引 107
4.6 Pandas数据运算 108
4.6.1 算术运算 108
4.6.2 函数应用与映射运算 109
4.6.3 排序 111
4.6.4 迭代 113
4.6.5 唯一值与值计数 115
4.7 统计函数 116
4.7.1 描述性统计 116
4.7.2 变化率 119
4.7.3 协方差 120
4.7.4 相关性 120
4.7.5 数据排名 121
4.8 分组与聚合 122
4.8.1 分组 122
4.8.2 聚合 124
4.9 透视表与交叉表 127
4.9.1 透视表 127
4.9.2 交叉表 128
小结 129
习题 129
实验 129
第5章 数据预处理 134
5.1 数据清洗 134
5.1.1 重复值 134
5.1.2 缺失值 135
5.1.3 异常值 140
5.2 合并连接与重塑 142
5.2.1 merge合并 142
5.2.2 concat合并 144
5.2.3 combine_first合并 146
5.2.4 数据重塑 147
5.3 数据变换 149
5.3.1 虚拟变量 149
5.3.2 函数变换 150
5.3.3 连续属性离散化 151
5.3.4 规范化 152
5.3.5 随机采样 154
小结 156
习题 156
实验 156
第6章 Sklearn机器学习 162
6.1 术语 162
6.2 Sklearn 164
6.2.1 Sklearn数据集 165
6.2.2 Sklearn常用算法 171
6.2.3 数据预处理 175
6.2.4 数据集拆分 177
6.2.5 模型评估 177
6.2.6 Sklearn常用方法 178
6.2.7 模型的保存和载入 179
6.3 降维 179
6.3.1 PCA(主成分分析) 179
6.3.2 LDA(线性评价分析) 181
6.4 回归 182
6.4.1 线性回归 183
6.4.2 逻辑回归 184
6.4.3 回归决策树 185
6.5 分类 186
6.5.1 朴素贝叶斯 187
6.5.2 分类决策树 188
6.5.3 SVM(支持向量机) 189
6.5.4 神经网络 190
6.5.5 K?近邻算法 191
6.6 聚类 192
6.6.1 K?means算法 193
6.2.2 DBSCAN 194
小结 195
习题 195
实验 196
参考文献 200
1.1 数据分析的概念、流程和应用 1
1.1.1 数据分析的概念 1
1.1.2 数据分析的流程 2
1.1.3 数据分析的应用 2
1.2 数据分析工具 3
1.2.1 常用工具 4
1.2.2 Python数据分析 4
1.3 Python数据分析环境 5
小结 9
习题 9
实验 10
第2章 NumPy数值计算 15
2.1 NumPy多维数组 15
2.1.1 数组创建 15
2.1.2 数组对象属性 22
2.1.3 数组数据类型 23
2.2 数组操作 24
2.2.1 修改数组形状 24
2.2.2 翻转数组 26
2.2.3 连接数组 27
2.2.4 分割数组 28
2.2.5 数组元素添加与删除 30
2.3 数组索引与切片 32
2.3.1 数组索引 32
2.3.2 数组切片 33
2.3.3 布尔型索引 34
2.3.4 花式索引 35
2.4 数组的运算 35
2.4.1 数组和标量间的运算 35
2.4.2 广播 36
2.4.3 算术函数 37
2.4.4 集合运算 40
2.4.5 统计运算 41
2.4.6 排序 43
2.4.7 搜索 44
2.5 线性代数 45
2.5.1 数组相乘 46
2.5.2 矩阵行列式 46
2.5.3 逆矩阵 46
2.5.4 线性方程组 47
2.5.5 特征值和特征向量 47
2.6 数组的存取 48
小结 48
习题 48
实验 51
第3章 Matplotlib数据可视化 54
3.1 线形图 54
3.1.1 绘制线形图 54
3.1.2 颜色设置 55
3.1.3 线型设置 56
3.1.4 坐标点设置 57
3.1.5 线宽设置 59
3.2 其他图形 59
3.2.1 散点图 59
3.2.2 柱形图 61
3.2.3 条形图 63
3.2.4 饼图 64
3.2.5 直方图 65
3.2.6 箱线图 67
3.3 自定义设置 69
3.3.1 图例设置 69
3.3.2 坐标网格设置 70
3.3.3 坐标系设置 71
3.3.4 样式设置与注解 72
3.3.5 RC设置 73
3.4 子图 74
3.4.1 创建子图 74
3.4.2 子图坐标系设置 76
3.4.3 图形嵌套 77
3.5 绘制三维图形 78
小结 81
习题 82
实验 82
第4章 Pandas数据分析 89
4.1 Pandas数据结构 89
4.2 DataFrame基本功能 94
4.3 读取外部数据 95
4.3.1 CSV文件 96
4.3.2 Sqlite数据库 98
4.4 数据帧的列操作和行操作 99
4.4.1 列操作 99
4.4.2 行操作 101
4.5 高级索引 103
4.5.1 重建索引 103
4.5.2 更换索引 106
4.5.3 层次化索引 107
4.6 Pandas数据运算 108
4.6.1 算术运算 108
4.6.2 函数应用与映射运算 109
4.6.3 排序 111
4.6.4 迭代 113
4.6.5 唯一值与值计数 115
4.7 统计函数 116
4.7.1 描述性统计 116
4.7.2 变化率 119
4.7.3 协方差 120
4.7.4 相关性 120
4.7.5 数据排名 121
4.8 分组与聚合 122
4.8.1 分组 122
4.8.2 聚合 124
4.9 透视表与交叉表 127
4.9.1 透视表 127
4.9.2 交叉表 128
小结 129
习题 129
实验 129
第5章 数据预处理 134
5.1 数据清洗 134
5.1.1 重复值 134
5.1.2 缺失值 135
5.1.3 异常值 140
5.2 合并连接与重塑 142
5.2.1 merge合并 142
5.2.2 concat合并 144
5.2.3 combine_first合并 146
5.2.4 数据重塑 147
5.3 数据变换 149
5.3.1 虚拟变量 149
5.3.2 函数变换 150
5.3.3 连续属性离散化 151
5.3.4 规范化 152
5.3.5 随机采样 154
小结 156
习题 156
实验 156
第6章 Sklearn机器学习 162
6.1 术语 162
6.2 Sklearn 164
6.2.1 Sklearn数据集 165
6.2.2 Sklearn常用算法 171
6.2.3 数据预处理 175
6.2.4 数据集拆分 177
6.2.5 模型评估 177
6.2.6 Sklearn常用方法 178
6.2.7 模型的保存和载入 179
6.3 降维 179
6.3.1 PCA(主成分分析) 179
6.3.2 LDA(线性评价分析) 181
6.4 回归 182
6.4.1 线性回归 183
6.4.2 逻辑回归 184
6.4.3 回归决策树 185
6.5 分类 186
6.5.1 朴素贝叶斯 187
6.5.2 分类决策树 188
6.5.3 SVM(支持向量机) 189
6.5.4 神经网络 190
6.5.5 K?近邻算法 191
6.6 聚类 192
6.6.1 K?means算法 193
6.2.2 DBSCAN 194
小结 195
习题 195
实验 196
参考文献 200
猜您喜欢