书籍详情
Python数据分析从0到1
作者:邓立文,俞心宇,牛瑶 著
出版社:清华大学出版社
出版时间:2022-01-01
ISBN:9787302587170
定价:¥129.00
购买这本书可以去
内容简介
本书以Python作为数据分析的工具,系统地介绍数据分析所需的核心知识点,为书中的数据分析任务提供分析说明、代码示例和极为详细的代码注释,对于代码中出现的重要知识点会细心地为读者标注出相关内容在书中出现的章节位置。 全书共11章,分为3篇:初识篇、基础篇和进阶篇。初识篇(第1和2章),主要介绍数据分析和Python的相关基础概念,一些数据分析的具体应用场景及Python的集成开发环境;基础篇(第3~9章),主要介绍Python的基础语法,自动化办公的基础操作,数据可视化库Matplotlib和Seaborn,数据分析的核心库Numpy和Pandas,提供了大量翔实有趣的编程和数据分析示例;进阶篇(第10和11章),主要介绍了机器学习的入门基础理论知识和代码实现,监督学习和无监督学习的各种典型算法,涉及机器学习和数据挖掘的常用库scikit-learn及神经网络框架PyTorch等的使用,还介绍了编程算法中的动态规划,数据分析的实战例子。 本书面向初学者,可以作为高等院校各专业的数据分析课程教材,也可以作为广大数据分析从业者、爱好者、办公人员、科研人员的参考和学习用书。
作者简介
邓立文 厦门大学智能多媒体技术实验室成员。承担过多项数据分析与挖掘相关的科研项目工作,曾多次在各类数据科学竞赛中获奖,积累了丰富的实践经验,对数据分析有着深刻的理解,从事健康医疗大数据、机器学习和系统开发相关研究工作。俞心宇厦门大学数据挖掘与计算智能实验室成员。曾多次在国赛、美赛等各项数学建模和数据分析竞赛中获奖,在多个科研项目中承担过数据分析和挖掘工作,有丰富的数据分析相关项目经历,从事生物信息学相关研究工作。牛瑶厦门大学智能多媒体技术实验室成员。曾多次在国赛等各项数学建模竞赛及厦门大学思维逻辑大赛中获奖,在多个科研项目中承担过数据分析工作,有丰富的数据分析相关项目经历,从事医疗视觉和机器学习相关研究工作。
目录
初识篇
第1章Python与数据分析
1.1数据分析概念
1.2为什么使用Python
1.2.1智能时代的通用语言
1.2.2强大高效的第三方库
1.2.3轻松的代码结合能力
1.3数据分析领域的应用场景
1.3.1医疗健康
1.3.2交通出行
1.3.3商业策略
1.3.4经济金融
1.3.5城乡规划
1.3.6气象变化
1.3.7科研及自动化办公
1.4本章小结
第2章初识Python
2.1Python语言特点
2.2Python安装方式
2.2.1Anaconda安装
2.2.2官网安装
2.3Python集成开发环境
2.3.1Jupyter Notebook
2.3.2Spyder
2.3.3PyCharm
2.4本章小结
基础篇
第3章Python基础
3.1变量与赋值
3.1.1变量
3.1.2赋值
3.2输入与输出
3.2.1输入
3.2.2输出
3.3Python对象
3.3.1Python对象的概念
3.3.2变量与对象的关系
3.4数据类型
3.4.1数字
3.4.2字符串
3.4.3列表
3.4.4元组
3.4.5字典
3.4.6集合
3.5运算符与表达式
3.5.1算术运算符
3.5.2比较运算符
3.5.3逻辑运算符
3.5.4位运算符
3.5.5赋值运算符
3.5.6成员运算符
3.5.7身份运算符
3.6选择结构
3.6.1if语句
3.6.2ifelse语句
3.6.3ifelifelse语句
3.7循环结构
3.7.1while循环
3.7.2for循环
3.7.3循环嵌套
3.7.4循环控制语句
3.8综合示例
3.9本章小结
第4章Python函数与模块
4.1函数
4.1.1函数的概念
4.1.2函数的声明
4.1.3函数的参数
4.1.4函数的调用及参数值的传递过程
4.1.5变量的作用域
4.1.6lambda函数
4.1.7函数编程示例
4.1.8递归函数
4.2第三方模块
4.2.1概念与作用
4.2.2第三方模块的导入与使用
4.3本章小结
第5章面向对象编程
5.1面向对象
5.1.1类和对象的概念
5.1.2面向过程编程与面向对象编程比较
5.2类、对象的创建和使用
5.2.1类的定义及实例化
5.2.2类变量和类方法的权限
5.2.3综合示例
5.3类的继承
5.3.1继承的概念
5.3.2继承的语法和使用
5.4Python中的异常处理机制
5.4.1异常的概念
5.4.2异常处理语句
5.4.3assert断言
5.4.4自定义异常
5.5本章小结
第6章Python文件操作
6.1文件字符的编码方式
6.2Python文件的操作步骤
6.3文件的打开与关闭
6.4文件的读取与写入
6.5Excel文件操作库简介
6.6Python文件的批量自动化操作
6.7本章小结
第7章数据可视化
7.1Matplotlib
7.1.1Matplotlib简介及安装
7.1.2Matplotlib绘图基础
7.1.3默认属性值的修改与绘图填充
7.1.4常用绘图形式
7.1.5词云
7.2Seaborn
7.2.1折线图
7.2.2散点图
7.2.3关联图
7.2.4直方图
7.2.5其他常用绘图形式
7.2.6绘图风格与数据分组
7.3本章小结
第8章数值计算扩展库
8.1NumPy简介及安装
8.2数组的创建
8.3数组对象ndarray的常用属性
8.4数组对象的数据取值
8.4.1索引取值
8.4.2索引列表取值
8.4.3切片取值
8.4.4布尔取值
8.4.5搭配取值
8.4.6迭代取值
8.5数组对象元素的更新
8.6数组对象的合并与拆分
8.7数组对象的基本运算与广播机制
8.8数组对象支持的数据类型
8.9数组对象的维度转换
8.10NumPy的随机数组
8.11数组对象的常用数据统计函数
8.12数据处理常用操作
8.13数组对象的常用数学函数
8.14NumPy与线性代数计算
8.15NumPy文件和批量数据操作
8.16本章小结
第9章结构化数据分析库
9.1Pandas简介及安装
9.2Pandas支持的数据类型
9.3Series对象详细讲解
9.3.1Series对象的创建方法
9.3.2Series对象的属性
9.3.3Series对象的取值
9.3.4Series对象的更新
9.3.5Series对象的基本运算
9.3.6Series对象的统计函数
9.3.7Series对象的字符串处理
9.3.8Series对象的常用函数
9.4DataFrame对象详细讲解
9.4.1DataFrame对象的创建方法
9.4.2DataFrame对象的属性
9.4.3DataFrame对象的取值
9.4.4DataFrame对象的更新
9.4.5DataFrame对象的基本运算
9.4.6DataFrame对象的统计函数
9.4.7DataFrame对象的字符串处理
9.4.8DataFrame对象的常用函数
9.5Pandas的文件操作
9.5.1读取和写入Excel文件
9.5.2批量处理多个Excel文件数据
9.5.3读取和写入csv文件
9.5.4读取和写入txt文件
9.6Pandas的数据分组与聚合
9.6.1数据分组
9.6.2数据聚合
9.6.3综合示例
9.7Pandas的透视表与交叉表
9.7.1透视表
9.7.2交叉表
9.8Pandas的数据预处理
9.8.1缺失值处理
9.8.2重复值处理
9.8.3归一化处理
9.8.4有效性审校
9.8.5连续值离散化
9.8.6离散值编码
9.9Pandas的时间序列处理
9.9.1创建时间序列
9.9.2时间序列格式化
9.9.3时间序列运算
9.9.4时间序列属性
9.9.5时间序列处理综合示例
9.10Pandas数据的可视化
9.11本章小结
进阶篇
第10章数据分析常用算法
10.1机器学习基础
10.2监督学习算法
10.2.1线性回归
10.2.2逻辑回归
10.2.3KNN算法
10.2.4基于PyTorch搭建神经网络
10.2.5线性判别分析
10.2.6朴素贝叶斯分类器
10.2.7SVM支持向量机
10.2.8决策树
10.3无监督学习算法
10.3.1聚类
10.3.2PCA数据降维
10.4编程算法在数据分析中的应用
10.4.1编程算法与数据分析
10.4.2动态规划算法概念
10.4.3动态规划算法编程示例
10.4.4动态规划算法在数据分析中的应用示例
10.5本章小结
第11章数据分析实战
11.1数据集介绍
11.2实战演练
11.2.1数据预处理
11.2.2统计分析与绘图
11.2.3机器学习建模
11.3本章小结
参考文献
第1章Python与数据分析
1.1数据分析概念
1.2为什么使用Python
1.2.1智能时代的通用语言
1.2.2强大高效的第三方库
1.2.3轻松的代码结合能力
1.3数据分析领域的应用场景
1.3.1医疗健康
1.3.2交通出行
1.3.3商业策略
1.3.4经济金融
1.3.5城乡规划
1.3.6气象变化
1.3.7科研及自动化办公
1.4本章小结
第2章初识Python
2.1Python语言特点
2.2Python安装方式
2.2.1Anaconda安装
2.2.2官网安装
2.3Python集成开发环境
2.3.1Jupyter Notebook
2.3.2Spyder
2.3.3PyCharm
2.4本章小结
基础篇
第3章Python基础
3.1变量与赋值
3.1.1变量
3.1.2赋值
3.2输入与输出
3.2.1输入
3.2.2输出
3.3Python对象
3.3.1Python对象的概念
3.3.2变量与对象的关系
3.4数据类型
3.4.1数字
3.4.2字符串
3.4.3列表
3.4.4元组
3.4.5字典
3.4.6集合
3.5运算符与表达式
3.5.1算术运算符
3.5.2比较运算符
3.5.3逻辑运算符
3.5.4位运算符
3.5.5赋值运算符
3.5.6成员运算符
3.5.7身份运算符
3.6选择结构
3.6.1if语句
3.6.2ifelse语句
3.6.3ifelifelse语句
3.7循环结构
3.7.1while循环
3.7.2for循环
3.7.3循环嵌套
3.7.4循环控制语句
3.8综合示例
3.9本章小结
第4章Python函数与模块
4.1函数
4.1.1函数的概念
4.1.2函数的声明
4.1.3函数的参数
4.1.4函数的调用及参数值的传递过程
4.1.5变量的作用域
4.1.6lambda函数
4.1.7函数编程示例
4.1.8递归函数
4.2第三方模块
4.2.1概念与作用
4.2.2第三方模块的导入与使用
4.3本章小结
第5章面向对象编程
5.1面向对象
5.1.1类和对象的概念
5.1.2面向过程编程与面向对象编程比较
5.2类、对象的创建和使用
5.2.1类的定义及实例化
5.2.2类变量和类方法的权限
5.2.3综合示例
5.3类的继承
5.3.1继承的概念
5.3.2继承的语法和使用
5.4Python中的异常处理机制
5.4.1异常的概念
5.4.2异常处理语句
5.4.3assert断言
5.4.4自定义异常
5.5本章小结
第6章Python文件操作
6.1文件字符的编码方式
6.2Python文件的操作步骤
6.3文件的打开与关闭
6.4文件的读取与写入
6.5Excel文件操作库简介
6.6Python文件的批量自动化操作
6.7本章小结
第7章数据可视化
7.1Matplotlib
7.1.1Matplotlib简介及安装
7.1.2Matplotlib绘图基础
7.1.3默认属性值的修改与绘图填充
7.1.4常用绘图形式
7.1.5词云
7.2Seaborn
7.2.1折线图
7.2.2散点图
7.2.3关联图
7.2.4直方图
7.2.5其他常用绘图形式
7.2.6绘图风格与数据分组
7.3本章小结
第8章数值计算扩展库
8.1NumPy简介及安装
8.2数组的创建
8.3数组对象ndarray的常用属性
8.4数组对象的数据取值
8.4.1索引取值
8.4.2索引列表取值
8.4.3切片取值
8.4.4布尔取值
8.4.5搭配取值
8.4.6迭代取值
8.5数组对象元素的更新
8.6数组对象的合并与拆分
8.7数组对象的基本运算与广播机制
8.8数组对象支持的数据类型
8.9数组对象的维度转换
8.10NumPy的随机数组
8.11数组对象的常用数据统计函数
8.12数据处理常用操作
8.13数组对象的常用数学函数
8.14NumPy与线性代数计算
8.15NumPy文件和批量数据操作
8.16本章小结
第9章结构化数据分析库
9.1Pandas简介及安装
9.2Pandas支持的数据类型
9.3Series对象详细讲解
9.3.1Series对象的创建方法
9.3.2Series对象的属性
9.3.3Series对象的取值
9.3.4Series对象的更新
9.3.5Series对象的基本运算
9.3.6Series对象的统计函数
9.3.7Series对象的字符串处理
9.3.8Series对象的常用函数
9.4DataFrame对象详细讲解
9.4.1DataFrame对象的创建方法
9.4.2DataFrame对象的属性
9.4.3DataFrame对象的取值
9.4.4DataFrame对象的更新
9.4.5DataFrame对象的基本运算
9.4.6DataFrame对象的统计函数
9.4.7DataFrame对象的字符串处理
9.4.8DataFrame对象的常用函数
9.5Pandas的文件操作
9.5.1读取和写入Excel文件
9.5.2批量处理多个Excel文件数据
9.5.3读取和写入csv文件
9.5.4读取和写入txt文件
9.6Pandas的数据分组与聚合
9.6.1数据分组
9.6.2数据聚合
9.6.3综合示例
9.7Pandas的透视表与交叉表
9.7.1透视表
9.7.2交叉表
9.8Pandas的数据预处理
9.8.1缺失值处理
9.8.2重复值处理
9.8.3归一化处理
9.8.4有效性审校
9.8.5连续值离散化
9.8.6离散值编码
9.9Pandas的时间序列处理
9.9.1创建时间序列
9.9.2时间序列格式化
9.9.3时间序列运算
9.9.4时间序列属性
9.9.5时间序列处理综合示例
9.10Pandas数据的可视化
9.11本章小结
进阶篇
第10章数据分析常用算法
10.1机器学习基础
10.2监督学习算法
10.2.1线性回归
10.2.2逻辑回归
10.2.3KNN算法
10.2.4基于PyTorch搭建神经网络
10.2.5线性判别分析
10.2.6朴素贝叶斯分类器
10.2.7SVM支持向量机
10.2.8决策树
10.3无监督学习算法
10.3.1聚类
10.3.2PCA数据降维
10.4编程算法在数据分析中的应用
10.4.1编程算法与数据分析
10.4.2动态规划算法概念
10.4.3动态规划算法编程示例
10.4.4动态规划算法在数据分析中的应用示例
10.5本章小结
第11章数据分析实战
11.1数据集介绍
11.2实战演练
11.2.1数据预处理
11.2.2统计分析与绘图
11.2.3机器学习建模
11.3本章小结
参考文献
猜您喜欢