书籍详情

Python数据分析从入门到精通

Python数据分析从入门到精通

作者:李梓萌 著

出版社:机械工业出版社

出版时间:2020-04-01

ISBN:9787111649885

定价:¥99.00

购买这本书可以去
内容简介
  Python数据分析从入门到精通循序渐进地讲解了使用Python语言实现数据分析的核心知识,并通过具体实例的实现过程演示了数据分析的方法和流程。Python数据分析从入门到精通共12章,内容包括Python语言基础、处理网络数据、网络爬虫实战、处理特殊文本格式、使用数据库保存数据、操作处理CSV文件、操作处理JSON数据、使用库matplotlib实现数据可视化处理、使用库pygal实现数据可视化处理、使用库numPy实现数据可视化处理、使用库pandas实现数据可视化处理和大数据实战案例。Python数据分析从入门到精通简洁而不失技术深度,内容丰富全面。不仅易于阅读,同时涵盖了其他同类图书中很少涉及的参考资料,是学习Python数据分析的实用教程。 Python数据分析从入门到精通适用于已了解Python语言基础语法、希望进一步提高自己Python开发水平的读者,还可作为大中专院校和培训学校相关专业师生的学习参考用书。
作者简介
  李梓萌,女,高级工程师,毕业于清华大学,,供职于阿里巴巴淘宝事业部。工作项目涉及金融科技、证券交易所、银行、生物信息学、基因组学、广告技术、基础设施、交通运输、能源、人力资源和娱乐等多个领域的数据分析工作。在预测分析、数据科学、机器学习、大数据、产品工程、高性能计算和云基础设施等项目中工作了8年。
目录
目录

前言

第1章 Python语言基础1
1.1 Python语言介绍1
1.1.1 Python语言的地位1
1.1.2 Python语言的优点2
1.2 安装Python3
1.2.1 在Windows系统中下载并安装
Python3
1.2.2 在MacOS系统中下载并安装
Python6
1.2.3 在Linux系统中下载并安装
Python6
1.3 Python开发工具介绍7
1.3.1 使用Python自带的开发工具
IDLE7
1.3.2 使用流行工具PyCharm7
1.4 认识第一段Python程序11
1.4.1 使用IDLE编码并运行11
1.4.2 使用命令行方式运行Python
程序12
1.4.3 使用交互式方式运行Python
程序12
1.4.4 使用PyCharm实现第一个Python
程序13
第2章 处理网络数据17
2.1 处理HTML和XML数据17
2.1.1 解析XML数据17
2.1.2 使用库beautiful soup解析数据25
2.1.3 使用库bleach解析数据27
2.1.4 使用库cssutils解析数据29
2.1.5 使用库html5lib解析数据31
2.1.6 使用库markupsafe解析数据31
2.1.7 使用库pyquery解析数据32
2.2 处理HTTP 数据34
2.2.1 使用内置的http包处理数据34
2.2.2 使用库requests处理数据36
2.2.3 使用库httplib2处理数据37
2.2.4 使用库urllib3处理数据41
2.3 处理URL 数据44
2.3.1 使用urllib包44
2.3.2 使用库furl处理数据47
2.3.3 使用库purl处理数据48
2.3.4 使用库webargs处理数据50
2.4 爬取新闻保存到XML文件并分析
特征关系50
2.4.1 爬虫抓取数据51
2.4.2 使用Stanford CoreNLP提取XML
数据的特征关系52
第3章 网络爬虫实战54
3.1 网络爬虫基础54
3.2 开发简单的网络爬虫应用程序55
3.2.1 爬虫抓取某高校教师信息55
3.2.2 抓取某吧的信息59
3.2.3 抓取XX百科64
3.2.4 爬虫抓取某网站的信息并保存到
本地68
3.3 使用爬虫框架Scrapy70
3.3.1 Scrapy框架基础71
3.3.2 搭建Scrapy环境72
3.3.3 创建第一个Scrapy项目72
3.3.4 抓取某电影网的热门电影信息76
3.3.5 抓取某网站中的照片并保存到
本地81
3.3.6 抓取某网站中的主播照片并保存到
本地82
第4章 处理特殊文本格式84
4.1 使用tablib模块84
4.1.1 基本用法84
4.1.2 操作数据集中的指定行和列86
4.1.3 删除并导出不同格式的数据87
4.1.4 生成一个Excel文件88
4.1.5 处理多个数据集89
4.1.6 使用标签过滤数据92
4.1.7 分离表格中的数据92
4.2 使用openpyxl处理Office
文件93
4.2.1 openpyxl基础93
4.2.2 使用openpyxl读取Excel文件的
数据96
4.2.3 将4组数据导入Excel文件96
4.2.4 在Excel文件中检索某关键字
数据98
4.2.5 将数据导入Excel文件并生成一个
图表99
4.3 使用pyexcel处理Office
文件100
4.3.1 使用pyexcel读取并写入CSV
文件100
4.3.2 使用pyexcel读取指定Excel文件中
每个单元格数据101
4.3.3 按列读取并显示指定Excel文件中
每个单元格数据102
4.3.4 读取显示Excel文件中的所有
数据102
4.3.5 将3组数据导入新建的Excel
文件103
4.3.6 以多种方式获取Excel数据104
4.3.7 将数据分别导入Excel文件和SQLite
数据库105
4.3.8 在Flask Web项目中使用pyexcel处理
数据106
4.4 使用python-docx处理Office
文件109
4.4.1 使用python-docx处理Office文件的
流程109
4.4.2 创建Word文档110
4.4.3 在Word中插入图片110
4.4.4 创建结构文档112
4.4.5 读取Word文档114
4.5 使用xlrd和xlwt读写Excel115
4.5.1 使用库xlrd115
4.5.2 使用库xlwt117
4.6 使用xlsxwriter操作Excel
文件118
4.6.1 使用库xlsxwriter的基本流程118
4.6.2 创建一个表格118
4.6.3 设置表格样式120
4.6.4 向Excel文件中插入图像122
4.6.5 向Excel文件中插入数据并绘制
柱状图123
4.6.6 向Excel文件中插入数据并绘制
散点图125
4.6.7 向Excel文件中插入数据并绘制
柱状图和饼状图126
第5章 使用数据库保存数据129
5.1 操作SQLite3数据库129
5.1.1 sqlite3模块介绍129
5.1.2 使用sqlite3模块操作SQLite3
数据库130
5.1.3 使用Flask+ SQLite3+ ECharts2实现
降水数据可视化系统132
5.2 操作MySQL数据库138
5.2.1 搭建PyMySQL环境138
5.2.2 实现数据库连接139
5.2.3 创建数据库表140
5.2.4 爬取XX站用户信息并保存到
MySQL数据库141
5.3 使用MariaDB数据库145
5.3.1 搭建MariaDB数据库环境145
5.3.2 在Python程序中使用MariaDB
数据库148
5.4 使用MongoDB数据库150
5.4.1 搭建MongoDB环境150
5.4.2 在Python程序中使用MongoDB
数据库151
5.5 使用ORM操作数据库154
5.5.1 Python和ORM154
5.5.2 使用SQLAlchemy155
5.5.3 使用mongoengine160
第6章 操作处理CSV文件163
6.1 内置CSV模块介绍163
6.1.1 内置成员163
6.1.2 操作CSV文件165
6.1.3 提取CSV数据并保存到MySQL
数据库172
6.1.4 提取CSV数据并保存到SQLite
数据库176
6.2 爬取图书信息并保存为CSV
文件178
6.2.1 实例介绍178
6.2.2 具体实现178
6.3 使用CSV文件保存Scrapy抓取的
数据181
6.3.1 搭建Scrap
猜您喜欢

读书导航