书籍详情
Python:数据科学的手段(第2版)
作者:吴喜之,张敏 著
出版社:中国人民大学出版社
出版时间:2021-01-01
ISBN:9787300286754
定价:¥42.00
购买这本书可以去
内容简介
学习自然语言必须依靠实践,学习计算机语言也一样。《Python:数据科学的手段(第2版)/数据分析与应用丛书》不采用详尽的使用手册式教学,而是通过实践帮助读者学会Python编程语言。如果你想开始学习Python,《Python:数据科学的手段(第2版)/数据分析与应用丛书》是一个良好的开端。《Python:数据科学的手段(第2版)/数据分析与应用丛书》比第1版增加了一倍的篇幅,内容选择和编排都有较大改动。《Python:数据科学的手段(第2版)/数据分析与应用丛书》四个部分共12章,首部分基础,包括第1章软件准备、第2章Python基础知识、第3章类和子类简介;第二部分基本模块,包括第4章numpy模块、第5章pandas模块、第6章matplotlib模块、第7章scipy模块;第三部分编程思维训练,包括第8章基本编程训练、第9章若干计算方法的编程训练;第四部分数据科学,包括第10章探索性数据分析及数据准备、第11章有监督学习概论、第12章一些有监督学习模型。
作者简介
吴喜之 ,北京大学数学力学系本科,美国北卡罗来纳大学统计博士。中国人民大学统计学院教授,博士生导师。曾在美国加利福尼亚大学、北卡罗来纳大学以及南开大学、北京大学等多所著名学府执教。
目录
第一部分 基础
第 1 章 软件准备
1.1 下载及安装 Python
1.2 Anaconda 的几种界面
1.3 下载并安装所需模块
第 2 章 Python 基础知识
2.1 一些基本常识
2.2 数组 (字符串、list、tuple、dict) 及与它们相关的函数和运算
2.3 函数、自定义函数、数组元素的计算、循环语句
2.4 伪随机数模块: random
2.5 变量的存储位置
2.6 数据输入输出
第 3 章 类和子类简介
3.1 class
3.2 subclass
第二部分 基本模块
第 4 章 numpy 模块
4.1 Numpy 数组的产生
4.2 数据文件的存取
4.3 数组 (包括矩阵) 及有关的运算
4.4 一些线性代数运算
4.5 关于日期和时间
4.6 多项式运算
4.7 向量化函数
第 5 章 pandas 模块
5.1 数据框的生成和基本性质
5.2 数据框文件的存取
5.3 对数据框元素 (行列) 的选择
5.4 数据框的一些简单计算
5.5 以变量的值作为条件的数据框操作例子
5.6 添加新变量, 删除变量、观测值或改变 index
5.7 数据框文件结构的改变
5.8 数据框文件的合并
5.9 pandas 序列的产生
5.10 pandas 序列的一些性质和计算
5.11 一个例子
5.12 pandas 专门的画图命令
第 6 章 matplotlib 模块
6.1 简单的图
6.2 几张图同框
6.3 排列几张图
6.4 三维图
第 7 章 scipy 模块
7.1 存取各种数据文件
7.2 常用的随机变量的分布及随机数的产生
7.3 自定义分布的随机变量及随机数的产生
7.4 定积分的数值计算 ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? 136
第三部分 编程思维训练
第 8 章 基本编程训练
8.1 基本编程
8.2 更多的和矩阵有关的编程
8.3 和若干简单应用有关的编程训练
8.4 在 Excel 表格之外处理 Excel 数据的训练
第 9 章 若干计算方法的编程训练
9.1 Markov 链
9.2 Gibbs 抽样
9.3 EM 算法
9.4 MCMC 的 Metropolis 算法
第四部分 数据科学
第 10 章 探索性数据分析及数据准备
10.1 把数据转换成常规容易处理的形式
10.2 对数据的简单数字概括
10.3 描述性图形概述
10.4 数据的准备
第 11 章 有监督学习概论
11.1 数据科学的核心内容
11.2 有监督学习
11.3 通过两个案例介绍有监督学习要素
第 12 章 一些有监督学习模型
12.1 线性最小二乘回归
12.2 Logistic 回归的二分类方法
12.3 决策树分类与回归
12.4 基于决策树的组合方法: Bagging、随机森林、HGboost
12.5 人工神经网络分类与回归
12.6 k 最近邻方法分类与回归
12.7 支持向量机方法分类
12.8 朴素贝叶斯方法分类
第 1 章 软件准备
1.1 下载及安装 Python
1.2 Anaconda 的几种界面
1.3 下载并安装所需模块
第 2 章 Python 基础知识
2.1 一些基本常识
2.2 数组 (字符串、list、tuple、dict) 及与它们相关的函数和运算
2.3 函数、自定义函数、数组元素的计算、循环语句
2.4 伪随机数模块: random
2.5 变量的存储位置
2.6 数据输入输出
第 3 章 类和子类简介
3.1 class
3.2 subclass
第二部分 基本模块
第 4 章 numpy 模块
4.1 Numpy 数组的产生
4.2 数据文件的存取
4.3 数组 (包括矩阵) 及有关的运算
4.4 一些线性代数运算
4.5 关于日期和时间
4.6 多项式运算
4.7 向量化函数
第 5 章 pandas 模块
5.1 数据框的生成和基本性质
5.2 数据框文件的存取
5.3 对数据框元素 (行列) 的选择
5.4 数据框的一些简单计算
5.5 以变量的值作为条件的数据框操作例子
5.6 添加新变量, 删除变量、观测值或改变 index
5.7 数据框文件结构的改变
5.8 数据框文件的合并
5.9 pandas 序列的产生
5.10 pandas 序列的一些性质和计算
5.11 一个例子
5.12 pandas 专门的画图命令
第 6 章 matplotlib 模块
6.1 简单的图
6.2 几张图同框
6.3 排列几张图
6.4 三维图
第 7 章 scipy 模块
7.1 存取各种数据文件
7.2 常用的随机变量的分布及随机数的产生
7.3 自定义分布的随机变量及随机数的产生
7.4 定积分的数值计算 ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? 136
第三部分 编程思维训练
第 8 章 基本编程训练
8.1 基本编程
8.2 更多的和矩阵有关的编程
8.3 和若干简单应用有关的编程训练
8.4 在 Excel 表格之外处理 Excel 数据的训练
第 9 章 若干计算方法的编程训练
9.1 Markov 链
9.2 Gibbs 抽样
9.3 EM 算法
9.4 MCMC 的 Metropolis 算法
第四部分 数据科学
第 10 章 探索性数据分析及数据准备
10.1 把数据转换成常规容易处理的形式
10.2 对数据的简单数字概括
10.3 描述性图形概述
10.4 数据的准备
第 11 章 有监督学习概论
11.1 数据科学的核心内容
11.2 有监督学习
11.3 通过两个案例介绍有监督学习要素
第 12 章 一些有监督学习模型
12.1 线性最小二乘回归
12.2 Logistic 回归的二分类方法
12.3 决策树分类与回归
12.4 基于决策树的组合方法: Bagging、随机森林、HGboost
12.5 人工神经网络分类与回归
12.6 k 最近邻方法分类与回归
12.7 支持向量机方法分类
12.8 朴素贝叶斯方法分类
猜您喜欢