书籍详情
零基础学Python爬虫、数据分析与可视化从入门到精通
作者:孟兵,李杰臣 著
出版社:机械工业出版社
出版时间:2021-01-01
ISBN:9787111668992
定价:¥89.80
购买这本书可以去
内容简介
Python 语言功能强大而灵活,具有很强的扩展性,同时它的语法又相对简洁易懂,没有编程基础的普通办公人员经过适当的学习也能轻松上手。本书以Python 语言为工具,从编程新手的角度和日常办公的需求出发,深入浅出地讲解如何通过Python 编程高效地完成数据的获取、处理、分析与可视化。全书共13 章。第1 章和第2 章主要讲解Python 编程环境的搭建和Python 语言的基础语法知识。第3 ~ 6章以数据处理与分析为主题,讲解NumPy 模块和pandas 模块的基本用法和实际应用。第7 ~ 9 章以数据获取为主题,由浅入深地讲解如何通过编写爬虫程序从网页上采集数据,并保存到数据库中。第10 章主要讲解自然语言处理技术在文本分词中的应用。第11 章和第12 章以数据可视化为主题,讲解如何使用Matplotlib 模块和pyecharts 模块绘制图表。第13 章通过量化金融案例对前面所学的知识进行了综合应用。 本书适合想要提高数据处理和分析效率的职场人士和办公人员阅读,也可供Python 编程爱好者参考。
作者简介
暂缺《零基础学Python爬虫、数据分析与可视化从入门到精通》作者简介
目录
第1 章 Python 快速上手
1.1 Python编程环境的搭建
1.2 Python的模块
1.2.1 初识模块
1.2.2 模块的安装
第2章 Python的基础语法知识
2.1 变量
2.2 数据类型:数字与字符串
2.2.1 数字
2.2.2 字符串
2.2.3 数据类型的查询
2.2.4 数据类型的转换
2.3 数据类型:列表、字典、元组与集合
2.3.1 列表
2.3.2 字典
2.3.3 元组和集合
2.4 运算符
2.4.1 算术运算符和字符串运算符
2.4.2 比较运算符
2.4.3 赋值运算符
2.4.4 逻辑运算符
2.5 编码基本规范
2.5.1 缩进
2.5.2 注释
2.6 控制语句
2.6.1 if语句
2.6.2 for语句
2.6.3 while语句
2.6.4 控制语句的嵌套
2.7 函数
2.7.1 内置函数
2.7.2 自定义函数
2.8 模块的导入
2.8.1 import语句导入法
2.8.2 from语句导入法
第3章 数组的存储和处理—NumPy模块
3.1 创建数组
3.1.1 使用array()函数创建数组
3.1.2 创建等差数组
3.1.3 创建随机数组
3.2 查看数组的属性
3.3 选取数组元素
3.3.1 一维数组的元素选取
3.3.2 二维数组的元素选取
3.4 数组的重塑与转置
3.4.1 一维数组的重塑
3.4.2 多维数组的重塑
3.4.3 数组的转置
3.5 数组的处理
3.5.1 添加数组元素
3.5.2 删除数组元素
3.5.3 处理数组的缺失值
3.5.4 处理数组的重复值
3.5.5 拼接数组
3.5.6 拆分数组
3.6 数组的运算
3.6.1 数组之间的四则运算
3.6.2 数组元素的统计运算
第4章 数据的简单处理—pandas模块入门
4.1 数据结构
4.1.1 Series对象
4.1.2 DataFrame对象
4.2 读取数据
4.2.1 读取Excel工作簿数据
4.2.2 读取csv文件数据
4.3 查看数据
4.3.1 查看数据的前几行
4.3.2 查看数据的行数和列数
4.3.3 查看数据的类型
4.4 选择数据
4.4.1 选择行数据
4.4.2 选择列数据
4.4.3 同时选择行列数据
4.5 修改行标签和列标签
第5章 数据的高级处理—pandas模块进阶
5.1 数据的查找和替换
5.1.1 查找数据
5.1.2 替换数据
5.2 数据的处理
5.2.1 插入数据
5.2.2 删除数据
5.2.3 处理缺失值
5.2.4 处理重复值
5.2.5 排序数据
5.2.6 筛选数据
5.3 数据表的处理
5.3.1 转置数据表的行列
5.3.2 将数据表转换为树形结构
5.3.3 数据表的拼接
5.4 数据的运算
5.4.1 数据的统计运算
5.4.2 获取数值分布情况
5.4.3 计算相关系数
5.4.4 分组汇总数据
5.4.5 创建数据透视表
5.5 案例:获取并分析股票历史数据
第6章 使用Python进行数据分析
6.1 相关性分析
6.1.1 获取股价数据
6.1.2 合并股价数据
6.1.3 股价数据相关性分析
6.2 假设检验
6.3 方差分析
6.3.1 方差分析的基本步骤
6.3.2 单因素方差分析的代码实现
6.3.3 双因素方差分析的代码实现
6.3.4 利用第三方模块快速完成方差分析
6.4 描述性统计分析
6.4.1 描述性统计指标的计算
6.4.2 数据的分布状态分析
6.4.3 数据的频数和频率分析
6.5 线性回归分析
6.5.1 线性回归分析的数学原理
6.5.2 线性回归分析的思路
6.5.3 广告费与销量的一元线性回归分析
6.5.4 不同渠道的广告费与销量的多元线性回归分析
第7章 Python爬虫基础
7.1 认识网页结构
7.1.1 查看网页的源代码
7.1.2 网页结构的组成
7.1.3 百度新闻页面结构剖析
7.2 requests模块
7.2.1 requests模块获取数据的方式
7.2.2 get()函数的参数介绍
7.3 案例:爬取豆瓣电影动画排行榜
7.4 正则表达式
7.4.1 正则表达式基础
7.4.2 用正则表达式提取数据
7.5 BeautifulSoup模块
7.5.1 实例化BeautifulSoup对象
7.5.2 用BeautifulSoup对象定位标签
7.5.3 从标签中提取文本内容和属性值
7.6 XPath表达式
7.6.1 实例化etree对象
7.6.2 用XPath表达式定位标签并提取数据
7.6.3 快速获取标签节点的XPath表达式
7.7 数据清洗
7.8 案例:爬取当当网的图书销售排行榜
第8章 Python爬虫进阶
8.1 Selenium模块基础
8.1.1 Selenium模块的安装与基本用法
8.1.2 Selenium模块的标签定位
8.1.3 Selenium模块的标签操作
8.2 Selenium模块进阶
8.2.1 模拟鼠标操作
8.2.2 标签处理 8.2.3 显式等待和隐式等待
8.3 案例:模拟登录12306
8.4 IP反爬的应对
8.4.1 IP反爬的应对思路
8.4.2 搭建代理IP池
8.4.3 实战案例
8.5 用cookie池模拟登录
8.5.1 用浏览器获取cookie信息
8.5.2 自动记录cookie信息
8.5.3 cookie池的搭建和使用
8.6 提高爬虫程序的数据爬取效率
8.6.1 多进程实现并行
8.6.2 进程池的创建
8.6.3 多线程实现并发
8.6.4 线程池的创建
8.6.5 多任务异步协程实现并发
8.6.6 多进程、多线程和多任务异步协程在爬虫中的应用
第9章 表格数据获取与数据库详解
9.1 表格类数据的获取
9.1.1 用于构建表格的标签
9.1.2 read_html()函数的基本用法
9.2 用数据库存取数据
9.2.1 数据库概述
9.2.2 MySQL的安装和配置
9.2.3 数据表的基本操作
9.2.4 数据表中数据的基本操作
9.2.5 用PyMySQL模块操作数据库
9.2.6 用pandas模块操作数据库
9.3 案例:爬取58同城租房信息
第10章 自然语言处理
10.1 NLP概述
10.1.1 NLP的应用领域和基本流程
10.1.2 文本分词方法
10.2 jieba分词器
10.2.1 jieba分词器的基础知识
10.2.2 jieba分词器的基本用法
10.2.3 调整词典
10.2.4 关键词提取
10.2.5 停用词过滤
10.2.6 词频统计
10.3 案例:新闻关键词的提取与汇总
第11章 数据可视化—Matplotlib模块
11.1 绘制基本图表
11.1.1 绘制柱形图
11.1.2 绘制条形图
11.1.3 绘制折线图
11.1.4 绘制面积图
11.1.5 绘制散点图
11.1.6 绘制饼图和圆环图
11.2 图表的绘制和美化技巧
11.2.1 在一张画布中绘制多个图表
11.2.2 添加图表元素
11.2.3 添加并设置网格线
11.2.4 调整坐标轴的刻度范围
11.3 绘制高级图表
11.3.1 绘制气泡图
11.3.2 绘制组合图
11.3.3 绘制直方图
11.3.4 绘制雷达图
11.3.5 绘制树状图
11.3.6 绘制箱形图
11.3.7 绘制玫瑰图
第12章 数据可视化神器—pyecharts模块
12.1 图表配置项
12.2 绘制漏斗图
12.3 绘制涟漪特效散点图
12.4 绘制水球图
12.5 绘制仪表盘
12.6 绘制词云图
12.7 绘制K线图
第13章 量化金融—股票信息挖掘与分析
13.1 案例介绍
13.2 获取汽车行业股票的基本信息
13.3 获取单只股票的历史行情数据
13.4 获取沪深A股涨幅前60名的信息
13.5 计算股票的月涨跌幅
13.6 股票相关性分析
13.7 股票价格预测
猜您喜欢