书籍详情
数据分析基础:Python实现
作者:贾俊平
出版社:中国人民大学出版社
出版时间:2022-05-01
ISBN:9787300305257
定价:¥38.00
购买这本书可以去
内容简介
本教材是为职业教育财经商贸大类专业学生的数据分析课程编写的教材。内容包括数据处理、描述性分析、推断性分析及一些常用的分析方法。教材以数据分析为基础,立足于数据类型和可视化目的对图形进行分类,使用python工具进行数据处理和分析。教材注重统计方法的应用,包含课程思政内容,每章开头均以问题与思考的形式引出本章的内容,对方法的介绍侧重于原理和应用,把繁杂的过程交给工具完成。教材配有例题和练习题的电子版数据,方便教师教学和学生学习。
作者简介
贾俊平,中国人民大学统计学院副教授,从事统计教学30多年,著有《统计学—基于R》《统计学—Python实现》《统计学—基于Excel》《统计学—基于SPSS》《统计学基础》《数据可视化分析—基于R语言》等多部教材和著作。编写的《统计学》(第7版)和《统计学基础》(第5版)分别荣获首届全国教材建设奖(高等教育类和职业教育和继续教育类)优秀教材奖。
目录
第1章 数据分析与Python 语言
1.1 数据分析概述
1.1.1 数据分析方法
1.1.2 数据分析工具
1.2 数据及其来源
1.2.1 数据及其分类
1.2.2 数据的来源
1.3 Python 的初步使用
1.3.1 Python 的下载与安装
1.3.2 模块的安装与加载
1.3.3 查看帮助文件
1.3.4 编写代码脚本
1.3.5 数据读取和保存
第2章 Python 数据处理
2.1 Python 的基本数据结构
2.1.1 数字和字符串
2.1.2 元组和列表
2.1.3 字典和集合
2.2 数组、序列和数据框
2.2.1 numpy 中的数组
2.2.2 pandas 中的序列和数据框
2.3 数据抽样和筛选
2.3.1 抽取简单随机样本
2.3.2 数据筛选
2.3.3 生成随机数
2.4 生成频数分布表
2.4.1 类别数据的频数表
2.4.2 数值数据的类别化
第3章 数据可视化分析
3.1 Python 绘图基础
3.1.1 Python 的主要绘图模块
3.1.2 基本绘图函数
3.1.3 图形布局
3.1.4 图形颜色、线型和标记
3.2 类别数据可视化
3.2.1 条形图
3.2.2 瀑布图和漏斗图
3.2.3 饼图和环形图
3.2.4 树状图
3.3 数值数据可视化
3.3.1 分布特征可视化
3.3.2 变量间关系可视化
3.3.3 样本相似性可视化
3.4 时间序列可视化
3.4.1 折线图
3.4.2 面积图
3.5 合理使用图表
第4章 数据的描述分析
4.1 数据水平的描述
4.1.1 平均数
4.1.2 分位数
4.1.3 众数
4.2 数据差异的描述
4.2.1 极差和四分位差
4.2.2 方差和标准差
4.2.3 离散系数
4.2.4 标准分数
4.3 分布形状的描述
4.3.1 偏度系数
4.3.2 峰度系数
4.4 Python 的综合描述函数
第5 章 推断分析基本方法
5.1 推断的理论基础
5.1.1 随机变量和概率分布
5.1.2 统计量的抽样分布
5.2 参数估计
5.2.1 估计方法和原理
5.2.2 总体均值的区间估计
5.2.3 总体比例的区间估计
5.3 假设检验
5.3.1 假设检验的步骤
5.3.2 总体均值的检验
5.3.3 总体比例的检验
第6章 相关与回归分析
6.1 变量间关系的分析
6.1.1 变量间的关系
6.1.2 相关关系的描述
6.1.3 相关关系的度量
6.2 一元线性回归建模
6.2.1 回归模型与回归方程
6.2.2 参数的最小平方估计
6.3 模型评估和检验
6.3.1 模型评估
6.3.2 显著性检验
6.4 回归预测和残差分析
6.4.1 回归预测
6.4.2 残差分析
第7章 时间序列分析
7.1 增长率分析
7.1.1 增长率与平均增长率
7.1.2 年化增长率
7.2 时间序列的成分和预测方法
7.2.1 时间序列的成分
7.2.2 预测方法的选择与评估
7.3 简单指数平滑预测
7.4 趋势预测
7.4.1 线性趋势预测
7.4.2 非线性趋势预测
7.5 时间序列平滑
参考文献
1.1 数据分析概述
1.1.1 数据分析方法
1.1.2 数据分析工具
1.2 数据及其来源
1.2.1 数据及其分类
1.2.2 数据的来源
1.3 Python 的初步使用
1.3.1 Python 的下载与安装
1.3.2 模块的安装与加载
1.3.3 查看帮助文件
1.3.4 编写代码脚本
1.3.5 数据读取和保存
第2章 Python 数据处理
2.1 Python 的基本数据结构
2.1.1 数字和字符串
2.1.2 元组和列表
2.1.3 字典和集合
2.2 数组、序列和数据框
2.2.1 numpy 中的数组
2.2.2 pandas 中的序列和数据框
2.3 数据抽样和筛选
2.3.1 抽取简单随机样本
2.3.2 数据筛选
2.3.3 生成随机数
2.4 生成频数分布表
2.4.1 类别数据的频数表
2.4.2 数值数据的类别化
第3章 数据可视化分析
3.1 Python 绘图基础
3.1.1 Python 的主要绘图模块
3.1.2 基本绘图函数
3.1.3 图形布局
3.1.4 图形颜色、线型和标记
3.2 类别数据可视化
3.2.1 条形图
3.2.2 瀑布图和漏斗图
3.2.3 饼图和环形图
3.2.4 树状图
3.3 数值数据可视化
3.3.1 分布特征可视化
3.3.2 变量间关系可视化
3.3.3 样本相似性可视化
3.4 时间序列可视化
3.4.1 折线图
3.4.2 面积图
3.5 合理使用图表
第4章 数据的描述分析
4.1 数据水平的描述
4.1.1 平均数
4.1.2 分位数
4.1.3 众数
4.2 数据差异的描述
4.2.1 极差和四分位差
4.2.2 方差和标准差
4.2.3 离散系数
4.2.4 标准分数
4.3 分布形状的描述
4.3.1 偏度系数
4.3.2 峰度系数
4.4 Python 的综合描述函数
第5 章 推断分析基本方法
5.1 推断的理论基础
5.1.1 随机变量和概率分布
5.1.2 统计量的抽样分布
5.2 参数估计
5.2.1 估计方法和原理
5.2.2 总体均值的区间估计
5.2.3 总体比例的区间估计
5.3 假设检验
5.3.1 假设检验的步骤
5.3.2 总体均值的检验
5.3.3 总体比例的检验
第6章 相关与回归分析
6.1 变量间关系的分析
6.1.1 变量间的关系
6.1.2 相关关系的描述
6.1.3 相关关系的度量
6.2 一元线性回归建模
6.2.1 回归模型与回归方程
6.2.2 参数的最小平方估计
6.3 模型评估和检验
6.3.1 模型评估
6.3.2 显著性检验
6.4 回归预测和残差分析
6.4.1 回归预测
6.4.2 残差分析
第7章 时间序列分析
7.1 增长率分析
7.1.1 增长率与平均增长率
7.1.2 年化增长率
7.2 时间序列的成分和预测方法
7.2.1 时间序列的成分
7.2.2 预测方法的选择与评估
7.3 简单指数平滑预测
7.4 趋势预测
7.4.1 线性趋势预测
7.4.2 非线性趋势预测
7.5 时间序列平滑
参考文献
猜您喜欢