书籍详情
Python数据科学实践
作者:常象宇,曾智亿,李春艳,程茜 著
出版社:北京大学出版社
出版时间:2020-07-01
ISBN:9787301313190
定价:¥69.00
购买这本书可以去
内容简介
《Python数据科学实践》是由狗熊会推出的一本利用Python介绍数据科学基本过程的著作。本书以Python语言为基础,介绍利用Python进行数据科学研究与商业分析的全貌。其核心的设计理念是通过经典的商业应用案例对数据爬取、数据存储、数据清洗、数据建模的核心Python模块做相应的介绍。 本书的特点是强调数据科学带来的商业价值理念,所以其可以作为高等学校数据科学、大数据管理与应用、统计或相关专业的教材,也适合从事数据分析的工作者和爱好者阅读。
作者简介
常象宇,西安交通大学管理学院副教授,西安交通大学应用数学系与加州大学伯克利分校统计系联合培养博士,华盛顿大学西雅图分校工业与系统工程系客座副教授,狗熊会联合创始人,负责欧亚·狗熊会数据科学研究院的工作。对人工智能、统计机器学习、深度学习等有深入研究。 曾智亿,毕业于西南交通大学金融学专业,曾参与西南交通大学智慧营销实验室、平安证券、建设银行、荣耀电商、三一重工等实习或驻场项目,对爬虫数据采集、数据分析、自然语言处理等有深入研究。 李春艳,西安交通大学工业工程专业硕士在读,曾参与狗熊会火锅系列精品案例的编写,以及参与新浪微博和百词斩等项目实践,对商务统计分析有深入研究。 程茜,西安欧亚学院金融学院教师。2015年进入狗熊会数据分析研究院,2017年开始承担金融学院数据科学与大数据技术专业教学工作,教授课程有编程和程序设计、回归分析和数据挖掘等。
目录
第1章 基于Python的数据科学环境搭建 1
1.1 Python是数据科学 “大势所趋”2
1.2 Anaconda入门 ——工欲善其事,必先利其器 4
1.3 Jupyter Notebook入门 15
1.4 Markdown单元格的使用 25
1.5 Spyder入门 34
1.6 小结 38
第2章 Python基础 39
2.1 “火锅团购数据”简介 40
2.2 读写数据 41
2.3 Python数据类型与结构 44
2.4 控制流、函数与模块 58
2.5 面向对象编程的基本概念 66
2.6 Numpy简介 72
2.7 小结 77
第3章 Python的数据处理模块 78
3.1 初级篇 ——相遇 Pandas79
3.2 进阶篇 ——相识 Pandas90
3.3 小结 99
第4章 Python的绘图模块 100
4.1 为什么需要数据可视化 101
4.2 初级篇 ——Matplotlib基础 102
4.3 高级篇 ——Plotly基础 121
4.4 小结 139
第5章 Python的统计建模模块 141
5.1 Statsmodels简介 142
5.2 数据接入 143
5.3 统计模型参数估计 145
5.4 统计假设检验 153
5.5 探索分析 159
5.6 小结 165
第6章 Python的机器学习模块 166
6.1 机器学习的定义 167
6.2 使用 scikit -learn169
6.3 小结 182
第7章 Python的爬虫模块 183
7.1 爬虫的定义 184
7.2 初级篇 ——单页面静态爬虫 185
7.3 中级篇 ——多页面静态爬虫 197
7.4 高级篇 ——爬虫的伪装 205
7.5 终级篇 ——动态爬虫 212
7.6 爬虫注意事项 217
7.7 小结 217
第8章 Python的文本分析模块 218
8.1 准备 :理解文本分析流程 219
8.2 实战 224
8.3 小结 232
第9章 Python的数据库模块 233
9.1 为什么需要数据库 234
9.2 初级篇 ——SQLAlchemy的基本使用 235
9.3 高级篇 244
9.4 小结 248
第10章 精品案例——火锅团购分析 249
10.1 背景介绍 250
10.2 数据描述 252
10.3 建模分析 264
10.4 小结 269
1.1 Python是数据科学 “大势所趋”2
1.2 Anaconda入门 ——工欲善其事,必先利其器 4
1.3 Jupyter Notebook入门 15
1.4 Markdown单元格的使用 25
1.5 Spyder入门 34
1.6 小结 38
第2章 Python基础 39
2.1 “火锅团购数据”简介 40
2.2 读写数据 41
2.3 Python数据类型与结构 44
2.4 控制流、函数与模块 58
2.5 面向对象编程的基本概念 66
2.6 Numpy简介 72
2.7 小结 77
第3章 Python的数据处理模块 78
3.1 初级篇 ——相遇 Pandas79
3.2 进阶篇 ——相识 Pandas90
3.3 小结 99
第4章 Python的绘图模块 100
4.1 为什么需要数据可视化 101
4.2 初级篇 ——Matplotlib基础 102
4.3 高级篇 ——Plotly基础 121
4.4 小结 139
第5章 Python的统计建模模块 141
5.1 Statsmodels简介 142
5.2 数据接入 143
5.3 统计模型参数估计 145
5.4 统计假设检验 153
5.5 探索分析 159
5.6 小结 165
第6章 Python的机器学习模块 166
6.1 机器学习的定义 167
6.2 使用 scikit -learn169
6.3 小结 182
第7章 Python的爬虫模块 183
7.1 爬虫的定义 184
7.2 初级篇 ——单页面静态爬虫 185
7.3 中级篇 ——多页面静态爬虫 197
7.4 高级篇 ——爬虫的伪装 205
7.5 终级篇 ——动态爬虫 212
7.6 爬虫注意事项 217
7.7 小结 217
第8章 Python的文本分析模块 218
8.1 准备 :理解文本分析流程 219
8.2 实战 224
8.3 小结 232
第9章 Python的数据库模块 233
9.1 为什么需要数据库 234
9.2 初级篇 ——SQLAlchemy的基本使用 235
9.3 高级篇 244
9.4 小结 248
第10章 精品案例——火锅团购分析 249
10.1 背景介绍 250
10.2 数据描述 252
10.3 建模分析 264
10.4 小结 269
猜您喜欢