书籍详情

大数据数学基础

大数据数学基础

作者:邱硕 著

出版社:电子工业出版社

出版时间:2022-02-01

ISBN:9787121425745

定价:¥68.00

购买这本书可以去
内容简介
  本书从大数据处理涉及的基础数学理论入手,围绕大数据研究涉及的基础数学知识,从线性代数、微积分、概率与统计、距离度量、优化问题及图论六大方面展开介绍,以夯实读者在大数据领域的理论基础。本书不仅介绍了基本的数学概念,而且通过具体例子介绍了其在大数据领域的实际应用,以提高本书的易读性。本书每章都附有相应的习题,以便读者能够进一步理解相应的知识点。
作者简介
  刘鹏,教授,清华大学博士,南京云创大数据科技股份有限公司总裁,中国大数据应用联盟人工智能专家委员会主任、中国信息协会教育分会人工智能教育专家委员会主任、教育部全国普通高校毕业生就业创业指导委员会委员,第45届世界技能大赛中国区云计算选拔赛裁判长/专家指导组组长,2019年全国大学生数据建模比赛命题人,工信部云计算研究中心专家。在云计算/大数据/人工智能领域具有多年研究积累,是我国该领域知名专家。主持科研项目40多项,发表论文80余篇,出版专业书籍30多本。曾于2002年获得全球数据处理比赛PennySort世界冠军,于2003年夺得全国挑战杯比赛总冠军。提出的反垃圾邮件网格,被IEEE Cluster 2003评为杰出网格项目,为解决困扰全球的垃圾邮件问题做出根本贡献,该技术成为云安全技术的基础。曾担任全军网格技术研究中心主任,获全军十大学习成才标兵(排名第一)、南京十大杰出青年、中国大数据创新百人、江苏省中青年领军人才、清华大学学术新秀等称号。
目录
第1章 线性代数\t1
1.1 行列式\t1
1.2 矩阵及其运算\t4
1.2.1 矩阵的概念\t4
1.2.2 矩阵的基本运算\t7
1.2.3 矩阵的乘法\t8
1.2.4 逆矩阵\t12
1.2.5 分块矩阵\t15
1.2.6 矩阵的初等变换\t19
1.2.7 应用举例\t27
1.3 向量组的线性相关性与矩阵的秩\t29
1.3.1 n维向量\t30
1.3.2 线性相关与线性无关\t31
1.3.3 向量组的秩\t33
1.3.4 矩阵的秩\t35
1.3.5 向量空间\t38
1.3.6 欧几里得空间与正交矩阵\t39
1.4 特征值与特征向量、矩阵的对角化\t45
1.4.1 矩阵的特征值与特征向量\t46
1.4.2 相似矩阵与矩阵对角化\t49
1.4.3 实对称矩阵的对角化\t56
习题\t59
本章参考文献\t61
第2章 微积分基础\t62
2.1 一元函数的导数\t62
2.1.1 导数的定义\t62
2.1.2 函数求导公式\t63
2.1.3 函数的求导法则\t64
2.2 一元函数的微分\t65
2.2.1 微分的概念\t65
2.2.2 基本一元函数的微分公式\t66
2.2.3 一元函数的微分运算法则\t66
2.2.4 一元函数微分的实际应用\t66
2.3 多元函数的导数与微分\t67
2.3.1 多元函数导数的定义\t67
2.3.2 多元复合函数的求导法则\t69
2.3.3 多元函数微分的定义\t69
2.3.4 全微分在近似计算中的应用\t70
2.4 向量与矩阵的导数\t70
2.4.1 矩阵导数的定义\t70
2.4.2 矩阵与向量求导法则\t71
2.5 导数与微分的应用\t74
2.5.1 极值\t75
2.5.2 中值定理\t78
习题\t80
本章参考文献\t81
第3章 概率与统计\t82
3.1 随机事件的概率\t82
3.1.1 随机事件\t82
3.1.2 随机事件的关系与运算\t83
3.1.3 随机事件的概率\t83
3.2 条件概率\t84
3.2.1 条件概率介绍\t84
3.2.2 乘法公式和事件的独立性\t84
3.2.3 全概率公式与贝叶斯公式\t85
3.3 随机变量\t87
3.3.1 一维随机变量\t87
3.3.2 多维随机变量\t94
3.4 随机变量的数字特征\t97
3.4.1 随机变量的数学期望\t97
3.4.2 方差\t100
3.4.3 协方差与相关系数\t103
3.5 极大似然估计\t106
3.5.1 简单抽样与统计量\t106
3.5.2 几个重要分布\t108
3.5.3 极大似然估计简介\t110
习题\t113
本章参考文献\t115
第4章 多维数据之间的距离度量\t116
4.1 涉及线性代数的距离\t116
4.1.1 欧几里得距离\t116
4.1.2 向量余弦距离\t116
4.1.3 闵氏距离\t118
4.2 涉及微积分的距离\t119
4.3 涉及概率统计的距离\t120
4.3.1 欧几里得距离标准化\t120
4.3.2 皮尔逊相关系数\t120
4.3.3 马氏距离\t121
4.3.4 直方相交距离\t122
4.3.5 巴氏距离\t126
4.3.6 卡方距离\t126
4.4 涉及其他数学知识的距离\t127
4.4.1 EMD\t127
4.4.2 编辑距离\t128
习题\t129
本章参考文献\t129
第5章 大数据中的优化问题\t130
5.1 最优化问题\t130
5.2 线性规划\t131
5.3 非线性优化问题\t136
5.3.1 向量和矩阵范数\t136
5.3.2 函数的可微性\t137
5.3.3 凸集和凸函数\t137
5.4 无约束非线性优化问题\t138
5.5 约束非线性优化问题\t141
5.6 支持向量机的优化模型及求解\t144
5.7 BP神经网络优化模型及解法\t147
5.8 回归分析中的优化模型及求解方法\t150
5.8.1 一元线性回归\t151
5.8.2 多元线性回归\t152
5.8.3 非线性回归\t154
习题\t156
本章参考文献\t157
第6章 大数据分析中的图论基础\t158
6.1 树、图的基本概念\t158
6.1.1 树的定义\t158
6.1.2 树的常用术语\t159
6.1.3 树的数据结构实现\t159
6.1.4 图的定义\t160
6.1.5 与图相关的概念\t160
6.2 图的最短路径问题\t161
6.2.1 Dijkstra算法介绍\t162
6.2.2 图例\t163
6.3 图的深度优先搜索\t165
6.3.1 基本策略\t166
6.3.2 实例说明\t166
6.3.3 算法伪代码\t168
6.4 频繁模式和关联规则\t169
6.4.1 经典频集方法\t169
6.4.2 关联规则的基本定义\t170
6.4.3 关联规则的分类\t171
6.4.4 频繁模式树\t172
6.5 频繁子图简介\t175
6.5.1 图论简要描述\t176
6.5.2 频繁子图挖掘的背景知识\t177
6.6 复杂网络简介\t177
6.6.1 复杂网络的研究内容\t178
6.6.2 复杂网络的基本概念\t178
6.6.3 常见的复杂网络\t179
6.6.4 复杂网络的应用\t180
6.7 最长公共子序列\t181
6.7.1 定义\t181
6.7.2 最优子序列性质\t181
6.7.3 LCS递归表达式\t182
6.7.4 动态规划方法求解LCS\t182
6.8 决策树\t184
6.8.1 决策树示例\t184
6.8.2 决策树的构成\t185
6.8.3 信息增益和信息增益比\t186
6.8.4 决策树的生成\t187
习题\t189
本章参考文献\t190
?
猜您喜欢

读书导航