书籍详情

Python数据分析与实践

Python数据分析与实践

作者:柳毅,毛峰,李艺 著

出版社:清华大学出版社

出版时间:2019-07-01

ISBN:9787302515791

定价:¥59.00

购买这本书可以去
内容简介
  Python是信息管理与信息系统、电子商务等信息管理类本科学生进行数据分析所需要掌握的基础性语言和分析工具,是未来学生掌握大数据分析技术的学习基础。本书共分12章,着重讲述Python语言和数据分析工具包的应用。 第1章主要介绍Python的发展历史、特点、集成开发环境、内置模块、帮助的使用等内容; 第2章主要介绍Python语言的基础知识; 第3章主要介绍Python中的常用数据结构,包括序列、字典、集合等,以及函数的定义和调用等; 第4章主要介绍Python中类、对象和方法的相关内容; 第5章主要介绍Python进行数据分析常用的NumPy、Pandas、Matplotlib、SciPy和Scikitlearn等基础库内容; 第6章主要介绍网络数据获取的HTML和XML两种网页组织形式,以及urllib和BeautifulSoup4两个模块内容; 第7章主要介绍文件的操作; 第8章主要介绍数据可视化,以及使用Python绘制图表的知识; 第9章主要介绍利用Python进行数据库应用开发; 第10、11章主要介绍Python机器学习的基本概念以及有监督、无监督学习算法的原理; 第12章主要介绍Python在地理空间分析上的应用。本书中的代码均在Python 3.5中测试通过。 本书一方面侧重对Python数据分析基础知识的讲解,另一方面注重Python数据处理方法的应用。本书适合作为计算机科学与技术专业学生学习数据分析的入门教材,也适合作为Python爱好者的参考书。
作者简介
暂缺《Python数据分析与实践》作者简介
目录
目录

第1章Python简介

1.1Python语言的发展史

1.1.1Python语言的特点

1.1.2Python 2与Python 3的区别

1.2Python的环境搭建

1.3开始使用Python IDLE

1.3.1交互方式

1.3.2Python的集成开发环境

1.4Eclipse+PyDev的安装

1.5代码风格

1.6使用帮助

本章小结

习题

第2章Python语言基础知识

2.1标识符与变量

2.1.1标识符

2.1.2变量

2.2数据类型及运算

2.2.1数据类型

2.2.2运算符和表达式

2.3分支结构控制语句

2.3.1if语句

2.3.2ifelse语句

2.3.3ifelifelse语句

2.4循环语句

2.4.1循环结构控制语句

2.4.2循环嵌套控制语句

2.4.3break语句和continue语句

2.4.4range()函数

2.5常见的Python函数

本章小结

习题

第3章数据结构与函数设计

3.1序列

3.1.1列表

3.1.2元组

3.1.3字符串

3.1.4列表与元组之间的转换

3.2字典

3.2.1创建字典

3.2.2字典的方法

3.2.3列表、元组与字典之间的转换

3.3集合

3.3.1集合的创建

3.3.2集合的运算

3.3.3集合的方法

3.4函数的定义

3.4.1函数的调用

3.4.2形参与实参

3.4.3函数的返回

3.4.4位置参数

3.4.5默认参数与关键字参数

3.4.6可变长度参数

本章小结

习题

第4章类与对象

4.1面向对象

4.1.1面向对象编程

4.1.2类的抽象与封装

4.2认识Python中的类、对象和方法

4.2.1类的定义与创建

4.2.2构造函数

4.3类的属性

4.3.1类属性和实例属性

4.3.2公有属性和私有属性

4.4类的方法

4.4.1类方法的调用

4.4.2类方法的分类

4.4.3析构函数

4.5类的继承

4.5.1父类与子类

4.5.2继承的语法

4.5.3多重继承

4.5.4运算符的重载

4.6类的组合

4.7类的异常处理

4.7.1异常

4.7.2Python中的异常类

4.7.3捕获与处理异常

4.7.4自定义异常类

4.7.5with语句

4.7.6断言

本章小结

习题

案例

第5章Python数据分析基础库

5.1NumPy

5.1.1ndarray的数据类型

5.1.2数组和标量之间的运算

5.1.3索引和切片

5.1.4数组转置和轴对换

5.1.5利用数组进行数据处理

5.1.6数学和统计方法

5.2Pandas

5.2.1Pandas数据结构

5.2.2Pandas文件操作

5.2.3数据处理

5.2.4层次化索引

5.2.5分级顺序

5.2.6使用DataFrame的列

5.3Matplotlib

5.3.1figure和subplot

5.3.2调整subplot周围的间距

5.3.3颜色、标记和线型

5.3.4刻度标签和图例

5.3.5添加图例

5.3.6将图表保存到文件

5.4SciPy

5.5Scikitlearn

本章小结

习题

第6章网络数据的获取

6.1网页数据的组织形式

6.1.1HTML

6.1.2HTML元素

6.1.3HTML属性

6.2XML

6.2.1XML的结构和语法

6.2.2XML元素和属性

6.3利用urllib处理HTTP

6.4利用BeautifulSoup4解析HTML文档

6.4.1BeautifulSoup4中的对象

6.4.2遍历文档树

6.4.3搜索文档树

本章小结

习题

第7章文件操作

7.1文件的打开和关闭

7.1.1打开文件

7.1.2关闭文件

7.2读写文件

7.2.1从文件读取数据

7.2.2向文件写入数据

7.3文件对话框

7.3.1基于win32ui构建文件对话框

7.3.2基于tkFileDialog构建文件对话框

7.4应用实例: 文本文件的操作

本章小结

习题

第8章Python数据可视化

8.1数据可视化概念框架

8.1.1数据可视化简介

8.1.2数据可视化常用图表

8.1.3Python数据可视化环境准备

8.2绘制图表

8.2.1Matplotlib API入门

8.2.2创建图表

8.2.3图表定制

8.2.4保存图表

8.3更多高级图表及定制

8.3.1样式

8.3.2subplot子区

8.3.3图表颜色和填充

8.3.4动画

本章小结

习题

第9章数据库应用开发

9.1Python与数据库

9.1.1数据库简介

9.1.2Python数据库工作环境

9.2本地数据库SQLite

9.2.1SQLite简介

9.2.2Python内置的sqlite3模块

9.3关系型数据库

9.3.1关系型数据库基本操作与SQL

9.3.2操作MySQL

9.4非关系型数据库

9.4.1NoSQL介绍

9.4.2MongoDB

9.4.3PyMongo: MongoDB和Python

习题

第10章机器学习——有监督学习

10.1机器学习简介

10.2Python机器学习库Scikitlearn

10.3有监督学习

10.3.1线性回归

10.3.2Logistic回归分类器

10.3.3朴素贝叶斯分类器

10.3.4支持向量机

10.3.5KNN算法

10.3.6决策树

本章小结

习题

第11章机器学习——无监督学习

11.1无监督学习

11.2聚类

11.2.1相异度

11.2.2KMeans算法

11.2.3DBSCAN算法

11.3关联规则

11.3.1关联分析

11.3.2Apriori算法

11.3.3FPgrowth算法

本章小结

习题

第12章Python地理空间分析

12.1地理空间分析简介

12.1.1地理空间分析的基本概念

12.1.2地理空间分析与Python

12.2地理空间数据

12.2.1数据格式概览

12.2.2数据特征

12.2.3矢量数据

12.2.4栅格数据

12.3Python地理空间分析工具

12.3.1GeoJSON

12.3.2GDAL和OGR

12.3.3PyShp

12.3.4PIL

12.3.5GeoPandas

12.4Python分析矢量数据

12.4.1访问矢量数据

12.4.2Shapefile文件操作

12.4.3空间查询

12.4.4叠加分析

12.5Python与遥感

12.5.1访问影像文件

12.5.2影像裁剪

12.5.3重采样

12.5.4影像分类

12.6“五水共治”资源地理空间分析综合应用

本章小结

习题
猜您喜欢

读书导航