书籍详情
数据科学的编程基础
作者:阮敬 著
出版社:首都经济贸易大学出版社
出版时间:2019-11-01
ISBN:9787563829835
定价:¥45.00
购买这本书可以去
内容简介
本书在编写过程中,首先收集了全世界380多所院校的数据科学和大数据相关的人才培养方案,然后使用非结构数据分析技术挖掘出编程类课程的主要内容,进而形成本书的主要雏形。笔者在其编写的《Python数据分析基础》(第1版和第2版)的基础上对雏形进行了完善。本书针对数据分析领域中编程类课程教学过程中的突出问题进行了仔细斟酌和调整,力求内容生动、深入浅出、言简意赅。全书采用mac OS Mojave操作系统下的Python3.7和Anaconda2018.12的Jupyter Notebook作为分析环境(如果读者使用Windows系统,也可运行本书全部代码),希望读者参考本书的内容边做边学习。
作者简介
阮敬,首都经济贸易大学统计学院教授,博士,博士生导师。现任首都经济贸易大学研究生院副院长,北京市丰台区政协委员。教研领域:数据挖掘与数据分析、收入分配。
目录
目录
1数据科学与编程语言(1)
1.1数据科学与数据分析(1)
1.2程序及其基本特征(2)
1.3算法(3)
1.3.1算法的表示方法(4)
1.3.2算法评价(7)
1.4数据结构(8)
1.5编程语言(9)
1.5.1Python语言(9)
1.5.2R语言(9)
1.5.3SAS语言(10)
2程序设计基础知识(11)
2.1结构化程序设计(12)
2.2面向对象的程序设计(13)
2.2.1抽象(13)
2.2.2基本概念(14)
2.2.3基本特性(17)
3Python系统配置与基础知识(19)
3.1Python系统配置(19)
3.2Python基础知识(24)
3.2.1帮助(25)
3.2.2标识符(25)
3.2.3行与缩进(26)
3.2.4变量与对象(27)
3.2.5数字与表达式(29)
3.2.6运算符(31)
3.2.7字符串(31)
3.2.8日期和时间(40)
3.2.9语法糖(42)
3.2.10魔术命令(43)
4数据结构与序列(45)
4.1列表(45)
4.1.1列表索引和切片(46)
4.1.2列表操作(47)
4.1.3内置列表函数(48)
4.1.4列表方法(49)
4.2元组(50)
4.3字典(51)
4.4集合(54)
4.5推导式(56)
5语句与控制流(59)
5.1顺序语句(59)
5.2条件语句(59)
5.3循环语句(61)
5.3.1while循环(61)
5.3.2for循环(62)
5.3.3循环控制(63)
6函数(67)
6.1函数的定义(67)
6.2函数的参数(68)
6.3全局变量与局部变量(70)
6.4匿名函数(71)
6.5递归和闭包(72)
6.6柯里化与反柯里化(74)
6.7常用的内置高阶函数(75)
6.7.1filter函数(75)
6.7.2map函数(75)
6.7.3reduce函数(76)
7迭代器、生成器与装饰器(77)
7.1迭代器(77)
7.2生成器(78)
7.3装饰器(81)
8类(85)
8.1声明类(85)
8.2方法(87)
8.2.1实例方法(87)
8.2.2类方法(89)
8.2.3静态方法(90)
8.3属性(91)
8.3.1实例属性和类属性(92)
8.3.2私有属性和公有属性(92)
8.4继承(94)
8.4.1隐式继承(94)
8.4.2显式覆盖(95)
8.4.3super继承(96)
8.4.4多态(98)
8.4.5多重继承(100)
8.5特性(100)
9多核并行(107)
9.1多进程(109)
92并行(113)
10异常捕获与容错处理(117)
10.1语法错误和异常(117)
10.2异常处理(120)
10.2.1触发异常(120)
10.2.2捕获异常(121)
10.2.3其他处理(122)
11模块和包(125)
11.1模块(125)
11.2包(127)
11.2.1包的组成与调用(127)
11.2.2常用数据分析工具库(128)
12文件I/O(133)
13numpy编程基础(137)
13.1关于numpy(137)
13.2向量(140)
13.3数组(142)
13.3.1数据类型与结构数组(143)
13.3.2索引与切片(145)
13.3.3数组的属性(150)
13.3.4数组排序(151)
13.3.5数组维度(153)
13.3.6数组组合(156)
13.3.7数组分拆(159)
13.3.8ufunc运算(160)
13.4矩阵(166)
13.5文件读写(167)
14pandas编程基础(169)
14.1关于pandas(169)
14.2pandas的数据结构(170)
14.2.1Series(170)
14.2.2DataFrame(174)
14.3pandas的数据操作(185)
14.3.1排序(185)
14.3.2排名(187)
14.3.3运算(189)
14.3.4函数应用与映射(190)
14.3.5分组(192)
14.3.6合并(192)
14.3.7分类数据(195)
14.4时间序列(196)
14.4.1创建时间序列(197)
14.4.2索引与切片(199)
14.4.3范围和偏移量(200)
14.4.4时间移动及运算(203)
14.4.5频率转换及重采样(205)
14.5面板数据与层次化索引(207)
14.5.1创建Panel(208)
14.5.2堆积DataFrame(209)
14.5.3层次化索引(209)
14.6缺失值处理(211)
14.6.1缺失数据的形式(211)
14.6.2缺失数据填充与清洗(213)
14.6.3缺失数据插值(216)
15图形与可视化的编程基础(217)
15.1matplotlib基本绘图(217)
15.1.1函数绘图(217)
15.1.2图形基本设置(224)
15.1.3面向对象绘图(231)
15.1.4绘图样式或风格(233)
15.2pandas基本绘图(234)
15.3基本统计图形(236)
15.3.1折线图(236)
15.3.2面积图(239)
15.3.3直方图(240)
15.3.4条形图(242)
15.3.5龙卷风图(247)
15.3.6饼图(247)
15.3.7阶梯图(249)
15.3.8盒须图(250)
15.3.9小提琴图(253)
15.3.10散点图(254)
15.3.11气泡图(257)
15.3.12六边形箱图(258)
15.3.13雷达坐标图(259)
15.3.14轮廓图(260)
15.3.15调和曲线图(261)
15.3.16等高线图(262)
15.3.17极坐标图(262)
15.3.18词云图(263)
15.3.19数据地图(267)
15.4其他绘图工具(269)
参考文献(271)
1数据科学与编程语言(1)
1.1数据科学与数据分析(1)
1.2程序及其基本特征(2)
1.3算法(3)
1.3.1算法的表示方法(4)
1.3.2算法评价(7)
1.4数据结构(8)
1.5编程语言(9)
1.5.1Python语言(9)
1.5.2R语言(9)
1.5.3SAS语言(10)
2程序设计基础知识(11)
2.1结构化程序设计(12)
2.2面向对象的程序设计(13)
2.2.1抽象(13)
2.2.2基本概念(14)
2.2.3基本特性(17)
3Python系统配置与基础知识(19)
3.1Python系统配置(19)
3.2Python基础知识(24)
3.2.1帮助(25)
3.2.2标识符(25)
3.2.3行与缩进(26)
3.2.4变量与对象(27)
3.2.5数字与表达式(29)
3.2.6运算符(31)
3.2.7字符串(31)
3.2.8日期和时间(40)
3.2.9语法糖(42)
3.2.10魔术命令(43)
4数据结构与序列(45)
4.1列表(45)
4.1.1列表索引和切片(46)
4.1.2列表操作(47)
4.1.3内置列表函数(48)
4.1.4列表方法(49)
4.2元组(50)
4.3字典(51)
4.4集合(54)
4.5推导式(56)
5语句与控制流(59)
5.1顺序语句(59)
5.2条件语句(59)
5.3循环语句(61)
5.3.1while循环(61)
5.3.2for循环(62)
5.3.3循环控制(63)
6函数(67)
6.1函数的定义(67)
6.2函数的参数(68)
6.3全局变量与局部变量(70)
6.4匿名函数(71)
6.5递归和闭包(72)
6.6柯里化与反柯里化(74)
6.7常用的内置高阶函数(75)
6.7.1filter函数(75)
6.7.2map函数(75)
6.7.3reduce函数(76)
7迭代器、生成器与装饰器(77)
7.1迭代器(77)
7.2生成器(78)
7.3装饰器(81)
8类(85)
8.1声明类(85)
8.2方法(87)
8.2.1实例方法(87)
8.2.2类方法(89)
8.2.3静态方法(90)
8.3属性(91)
8.3.1实例属性和类属性(92)
8.3.2私有属性和公有属性(92)
8.4继承(94)
8.4.1隐式继承(94)
8.4.2显式覆盖(95)
8.4.3super继承(96)
8.4.4多态(98)
8.4.5多重继承(100)
8.5特性(100)
9多核并行(107)
9.1多进程(109)
92并行(113)
10异常捕获与容错处理(117)
10.1语法错误和异常(117)
10.2异常处理(120)
10.2.1触发异常(120)
10.2.2捕获异常(121)
10.2.3其他处理(122)
11模块和包(125)
11.1模块(125)
11.2包(127)
11.2.1包的组成与调用(127)
11.2.2常用数据分析工具库(128)
12文件I/O(133)
13numpy编程基础(137)
13.1关于numpy(137)
13.2向量(140)
13.3数组(142)
13.3.1数据类型与结构数组(143)
13.3.2索引与切片(145)
13.3.3数组的属性(150)
13.3.4数组排序(151)
13.3.5数组维度(153)
13.3.6数组组合(156)
13.3.7数组分拆(159)
13.3.8ufunc运算(160)
13.4矩阵(166)
13.5文件读写(167)
14pandas编程基础(169)
14.1关于pandas(169)
14.2pandas的数据结构(170)
14.2.1Series(170)
14.2.2DataFrame(174)
14.3pandas的数据操作(185)
14.3.1排序(185)
14.3.2排名(187)
14.3.3运算(189)
14.3.4函数应用与映射(190)
14.3.5分组(192)
14.3.6合并(192)
14.3.7分类数据(195)
14.4时间序列(196)
14.4.1创建时间序列(197)
14.4.2索引与切片(199)
14.4.3范围和偏移量(200)
14.4.4时间移动及运算(203)
14.4.5频率转换及重采样(205)
14.5面板数据与层次化索引(207)
14.5.1创建Panel(208)
14.5.2堆积DataFrame(209)
14.5.3层次化索引(209)
14.6缺失值处理(211)
14.6.1缺失数据的形式(211)
14.6.2缺失数据填充与清洗(213)
14.6.3缺失数据插值(216)
15图形与可视化的编程基础(217)
15.1matplotlib基本绘图(217)
15.1.1函数绘图(217)
15.1.2图形基本设置(224)
15.1.3面向对象绘图(231)
15.1.4绘图样式或风格(233)
15.2pandas基本绘图(234)
15.3基本统计图形(236)
15.3.1折线图(236)
15.3.2面积图(239)
15.3.3直方图(240)
15.3.4条形图(242)
15.3.5龙卷风图(247)
15.3.6饼图(247)
15.3.7阶梯图(249)
15.3.8盒须图(250)
15.3.9小提琴图(253)
15.3.10散点图(254)
15.3.11气泡图(257)
15.3.12六边形箱图(258)
15.3.13雷达坐标图(259)
15.3.14轮廓图(260)
15.3.15调和曲线图(261)
15.3.16等高线图(262)
15.3.17极坐标图(262)
15.3.18词云图(263)
15.3.19数据地图(267)
15.4其他绘图工具(269)
参考文献(271)
猜您喜欢