书籍详情

Python 3 数据分析与机器学习实战

Python 3 数据分析与机器学习实战

作者:龙马高新教育

出版社:北京大学出版社

出版时间:2018-08-01

ISBN:9787301295663

定价:¥69.00

购买这本书可以去
内容简介
  机器之所以能学习,来源于大量的数据分析。《Python 3 数据分析与机器学习实战》首先讲述数据分析的过程,然后详细介绍常用的机器学习理论、算法与案例(大型案例 29 个),最终以解决实际问题驱动成书。 \n本书主要介绍的机器学习算法及数据分析方法,包括数据预处理、分类问题、预测问题、网络爬虫、数据降维、数据压缩、关联分析、集成学习和深度学习等。全书分三大部分共 17章 :第 0~3 章介绍 Python 的基础知识、安装和基本语法;第 4~7 章介绍 Python 的基本编程、机器学习基础及 Python 中常用的第三方库函数,并介绍数据预处理的基本方法;第 8~16 章分别介绍常用的机器学习分析算法及深度学习等。每章都采用多个经典案例图文并茂地介绍机器学习的原理和实现方法。 \n本书通熟易懂,并免费赠送全程同步教学录像和 Python 3 编程基础双录像,非常适合作为Python及机器学习和数据分析的入门与提高课程;对于不太熟悉Python、又想学习机器相关算法的初学者非常适合。
作者简介
  龙马高新教育团队成员有多年的编程工作经验,曾供职于某大型科技公司,担任软件工程师,从事大数据研发。Python技术的深度爱好者,对Java、Python有深入研究,做过大量的Python技术的课程培训。
目录

第0章 本书的技术体系 

0.1 Python的发展趋势 

0.2 人工智能时代学习Python的重要性 

0.3 本书的技术体系 

0.4 学习本书需要注意的事项 

第1章 Python基础知识 

1.1 Python简介 

1.1.1 了解Python的起源与发展历史 

1.1.2 Python的特色 

1.1.3 学习Python的原因 

1.2 Python的当前版本 

1.3 Python的优缺点 

1.4 Python与其他语言的区别 

1.5 Python的应用领域 

第2章 Python的安装、配置与卸载 

2.1 Python的安装 

2.1.1 Python的下载 

2.1.2 Python的安装 

2.2 Python的配置 

2.2.1 Python环境变量的设置 

2.2.2 Python的启动 

2.3 Python的卸载 

第3章 Python 3 基础语法 

3.1 第一个Python程序 

3.2 Python的输入和输出 

3.2.1 Python的输出语句 

3.2.2 Python的输入语句 

3.3 Python的基本数据类型 

3.3.1 数字 

3.3.2 字符串 

3.3.3 列表 

3.3.4 元组 

3.3.5 集合 

3.3.6 字典 

3.4 Python库的导入 

3.5 Python的集成开发环境 

3.6 自测练习 

第4章 Python 3的编程 

4.1 条件语句 

4.2 循环语句 

4.2.1 while循环 

4.2.2 for循环 

4.3 函数 

4.4 模块 

4.5 自测练习 

第5章 机器学习基础 

5.1 机器学习概述 

5.2 监督学习简介 

5.3 非监督学习简介 

5.4 增强学习简介 

5.5 深度学习简介 

5.6 机器学习常用术语 

第6章 Python 机器学习及分析工具 

6.1 矩阵操作函数库(NumPy) 

6.1.1 NumPy的安装 

6.1.2 NumPy的基本使用 

6.2 科学计算的核心包(SciPy) 

6.2.1 科学计算的核心包的安装 

6.2.2 科学计算的核心包的基本使用 

6.3 Python 的绘图库(Matplotlib) 

6.3.1 Matplotlib简介及安装 

6.3.2 Matplotlib的基本使用 

6.4 数据分析包(Pandas) 

6.4.1 Pandas简介和安装 

6.4.2 Pandas的基本使用方法 

6.5 机器学习函数库(Scikit-learn) 

6.6 统计建模工具包(StatsModels) 

6.7 深度学习框架(TensorFlow) 

第7章 数据预处理 

7.1 数据预处理概述 

7.2 数据清理 

7.2.1 异常数据处理 

7.2.2 缺失值处理 

7.2.3 噪声数据处理 

7.3 数据集成 

7.4 数据变换 

7.5 数据归约 

7.6 Python的主要数据预处理函数 

7.6.1 Python的数据结构 

7.6.2 数据缺失处理函数 

第8章 分类问题 

8.1 分类概述 

8.2 常用方法 

8.2.1 k-近邻算法 

8.2.2 朴素贝叶斯 

8.2.3 支持向量机 

8.2.4 AdaBoost算法 

8.2.5 决策树 

8.2.6 Multi-layer Perceptron 多层感知机 

8.3 项目实战 

8.3.1 实例1:使用k-近邻算法实现约会网站的配对效果 

8.3.2 实例2:使用朴素贝叶斯过滤垃圾邮件 

8.3.3 实例3:SVM实现手写识别系统 

8.3.4 实例4:基于单层决策树构建分类算法 

8.3.5 实例5:使用决策树对iris数据集分类 

8.3.6 实例6:使用决策树对身高体重数据进行分类 

8.3.7 实例7:使用k-近邻算法对鸢尾花数据进行交叉验证 

8.3.8 使用多层感知器分析,根据葡萄酒的各项化学特征来 

判断葡萄酒的优劣 

8.4 自测练习 

第9章 预测分析 

9.1 预测概述 

9.2 常用方法 

9.2.1 时间序列分析预测法 

9.2.2 BP神经网络模型 

9.3 项目实战 

9.3.1 实例1:根据一年的历史数据预测后十年的数据趋势 

9.3.2 实例2:使用神经网络预测公路运量 

9.4 自测练习 

第10章 关联分析 

10.1 关联分析概述 

10.2 基本方法 

10.2.1 Apriori算法 

10.2.2 FP-Growth算法 

10.3 项目实战(解决目前流行的实际问题) 

10.3.1 用Apriori进行关联分析的实例 

10.3.2 使用FP-Growth算法提取频繁项集 

10.4 自测练习 

第11章 网络爬虫 

11.1 网络爬虫概述 

11.1.1 网络爬虫原理 

11.1.2 爬虫分类 

11.2 网页抓取策略和方法 

11.2.1 网页抓取策略 

11.2.2 网页抓取的方法 

11.3 项目实战 

11.3.1 用Python抓取指定的网页 

11.3.2 用Python抓取包含关键词的网页 

11.3.3 下载贴吧中的图片 

11.3.4 股票数据抓取 

11.4 自测练习 

第12章 集成学习 

12.1 集成学习概述 

12.2 常用方法 

12.2.1 Bagging和随机森林 

12.2.2 Boosting和AdaBoost 

12.3 项目实战 

12.3.1 使用随机森林方法预测乘员的存活概率 

12.3.2 使用AdaBoost方法进行二元分类 

12.4 自测练习 

第13章 深度学习 

13.1 深度学习概述 

13.2 常用方法 

13.2.1 监督学习的深度学习网络结构 

13.2.2 非监督学习的深度学习网络结构 

13.3 项目实战 

13.3.1 使用TensorFlow框架进行MNIST数据集生成 

13.3.2 使用Theano框架进行MNIST数字识别 

13.4 自测练习 

第14章 数据降维及压缩 

14.1 数据降维及压缩概述 

14.1.1 数据降维 

14.1.2 图像压缩 

14.2 基本方法 

14.2.1 主成分分析 

14.2.2 奇异值分解 

14.3 项目实战 

14.3.1 主成分分析PCA实例 

14.3.2 使用奇异值分解进行图像压缩 

14.4 自测练习 

第15章 聚类分析 

15.1 聚类分析概述 

15.2 K-means算法 

15.2.1 K-means算法与步骤 

15.2.2 K-means算法涉及的问题 

15.2.3 实际聚类问题的处理流程 

15.3 项目实战 

15.3.1 K-means算法实现二维数据聚类 

15.3.2 使用Scikit-learn中的方法进行聚类分析 

15.4 自测练习 

第16章 回归分析问题 

16.1 回归分析概述 

16.2 基本方法 

16.2.1 一元回归分析 

16.2.2 多元线性回归 

16.2.3 回归的计算方法 

16.2.4 逻辑回归分析 

16.3 项目实战 

16.3.1 身高与体重的回归分析 

16.3.2 房价预测 

16.3.3 产品销量与广告的多元回归分析 

16.3.4 鸢尾花数据的逻辑回归分析 

16.4 自测练习

猜您喜欢

读书导航