书籍详情
数据科学与机器学习:数学与统计方法
作者:[澳]迪尔克·P. 克洛泽,[澳]兹德拉夫科·I. 波提夫,[澳]托马斯·泰姆勒,[澳]拉迪斯拉夫·维斯曼 著
出版社:机械工业出版社
出版时间:2022-11-01
ISBN:9787111711391
定价:¥139.00
购买这本书可以去
内容简介
本书旨在为有兴趣更好地理解数学和统计的学生提供一个可访问的、全面的教科书,这些数学和统计知识是数据科学和机器学习算法的基础。
作者简介
于俊伟,毕业于中科院自动化所,目前就职于河南工业大学信息科学与工程学院任讲师,主要从事计算机视觉、模式识别和智能信息处理等方向的研究。于老师自攻读博士学位以来,长期在视觉测量、图像处理、目标识别和视觉辅助导航等领域开展研究工作,参与自然科学基金、国防预先研究基金和863计划课题等多项科研项目,具有扎实的理论基础和丰富的工程实践经验。2010年进入河南工业大学工作以来,结合学校在粮油食品方面的行业优势,进行储粮信息的获取、处理及其融合等方向的研究,目前正在参与863课题“食品生物危害物精准检测与控制技术研究”的研究工作。完成国防科学技术报告3份,在国内外学术期刊及国际会议上发表论文10余篇,完成河南省科技成果鉴定一项。
目录
译者序
前言
数学符号
第1章导入、汇总和可视化
数据
11简介
12类型结构特征
13汇总表
14汇总统计量
15数据可视化
151定性变量绘图
152定量变量绘图
153双变量的数据可视化
16扩展阅读
17习题
第2章统计学习
21简介
22监督学习和无监督学习
23训练损失和测试损失
24统计学习中的权衡处理
25估计风险
251样本内风险
252交叉验证
26数据建模
27多元正态模型
28正态线性模型
29贝叶斯学习
210扩展阅读
211习题
第3章蒙特卡罗方法
31简介
32蒙特卡罗抽样
321生成随机数
322模拟随机变量
323模拟随机向量和随机
过程
324重采样
325马尔可夫链蒙特卡罗
33蒙特卡罗估计
331朴素蒙特卡罗
332自举法
333方差缩减
34蒙特卡罗优化
341模拟退火
342交叉熵方法
343分裂优化
344噪声优化
35扩展阅读
36习题
第4章无监督学习
41简介
42无监督学习的风险和损失
43期望大化算法
44经验分布和密度估计
45通过混合模型聚类
451混合模型
452混合模型的EM
算法
46向量量化聚类
461K均值
462通过连续多极值优化
进行聚类
47层次聚类
48主成分分析
481动机:椭球体的
主轴
482PCA和奇异值分解
49扩展阅读
410习题
第5章回归
51简介
52线性回归
53线性模型分析
531参数估计
532模型选择和预测
533交叉验证与预测残差
平方和
534样本内风险和赤池信
息准则
535分类特征
536嵌套模型
537决定系数
54正态线性模型的推理
541比较两个正态线性
模型
542置信区间和预测
区间
55非线性回归模型
56用Python实现线性模型
561建模
562分析
563方差分析
564置信区间和预测区间
565模型验证
566变量选择
57广义线性模型
58扩展阅读
59习题
第6章正则化和核方法
61简介
62正则化
63再生核希尔伯特空间
64再生核的构造
641通过特征映射构造
再生核
642根据特征函数构造
再生核
643利用正交特征构造
再生核
644通过核构造再生核
65表示定理
66平滑三次样条
67高斯过程回归
68核PCA
69扩展阅读
610习题
第7章分类
71简介
72分类评价指标
73基于贝叶斯规则的分类
74线性判别分析和二次判别
分析
75逻辑回归和softmax分类
76K近邻分类
77支持向量机
78使用ScikitLearn进行分类
79扩展阅读
710习题
第8章决策树和集成方法
81简介
82自顶向下的决策树构建方法
821区域预测函数
822分裂规则
823终止条件
824基本实现
83其他考虑因素
831二叉树与非二叉树
832数据预处理
833替代分裂规则
834类别变量
835缺失值
84控制树形
841代价复杂度剪枝
842决策树的优点和
局限性
85自举聚合
86随机森林
87提升法
88扩展阅读
89习题
第9章深度学习
91简介
92前馈神经网络
93反向传播
94训练方法
941速下降法
942LevenbergMarquardt
方法
943受限内存BFGS
方法
944自适应梯度法
95Python示例
951简单多项式回归
952图像分类
96扩展阅读
97习题
附录A线性代数与泛函分析
附录B多元微分与优化问题
附录C概率与统计
附录DPython入门
参考文献
前言
数学符号
第1章导入、汇总和可视化
数据
11简介
12类型结构特征
13汇总表
14汇总统计量
15数据可视化
151定性变量绘图
152定量变量绘图
153双变量的数据可视化
16扩展阅读
17习题
第2章统计学习
21简介
22监督学习和无监督学习
23训练损失和测试损失
24统计学习中的权衡处理
25估计风险
251样本内风险
252交叉验证
26数据建模
27多元正态模型
28正态线性模型
29贝叶斯学习
210扩展阅读
211习题
第3章蒙特卡罗方法
31简介
32蒙特卡罗抽样
321生成随机数
322模拟随机变量
323模拟随机向量和随机
过程
324重采样
325马尔可夫链蒙特卡罗
33蒙特卡罗估计
331朴素蒙特卡罗
332自举法
333方差缩减
34蒙特卡罗优化
341模拟退火
342交叉熵方法
343分裂优化
344噪声优化
35扩展阅读
36习题
第4章无监督学习
41简介
42无监督学习的风险和损失
43期望大化算法
44经验分布和密度估计
45通过混合模型聚类
451混合模型
452混合模型的EM
算法
46向量量化聚类
461K均值
462通过连续多极值优化
进行聚类
47层次聚类
48主成分分析
481动机:椭球体的
主轴
482PCA和奇异值分解
49扩展阅读
410习题
第5章回归
51简介
52线性回归
53线性模型分析
531参数估计
532模型选择和预测
533交叉验证与预测残差
平方和
534样本内风险和赤池信
息准则
535分类特征
536嵌套模型
537决定系数
54正态线性模型的推理
541比较两个正态线性
模型
542置信区间和预测
区间
55非线性回归模型
56用Python实现线性模型
561建模
562分析
563方差分析
564置信区间和预测区间
565模型验证
566变量选择
57广义线性模型
58扩展阅读
59习题
第6章正则化和核方法
61简介
62正则化
63再生核希尔伯特空间
64再生核的构造
641通过特征映射构造
再生核
642根据特征函数构造
再生核
643利用正交特征构造
再生核
644通过核构造再生核
65表示定理
66平滑三次样条
67高斯过程回归
68核PCA
69扩展阅读
610习题
第7章分类
71简介
72分类评价指标
73基于贝叶斯规则的分类
74线性判别分析和二次判别
分析
75逻辑回归和softmax分类
76K近邻分类
77支持向量机
78使用ScikitLearn进行分类
79扩展阅读
710习题
第8章决策树和集成方法
81简介
82自顶向下的决策树构建方法
821区域预测函数
822分裂规则
823终止条件
824基本实现
83其他考虑因素
831二叉树与非二叉树
832数据预处理
833替代分裂规则
834类别变量
835缺失值
84控制树形
841代价复杂度剪枝
842决策树的优点和
局限性
85自举聚合
86随机森林
87提升法
88扩展阅读
89习题
第9章深度学习
91简介
92前馈神经网络
93反向传播
94训练方法
941速下降法
942LevenbergMarquardt
方法
943受限内存BFGS
方法
944自适应梯度法
95Python示例
951简单多项式回归
952图像分类
96扩展阅读
97习题
附录A线性代数与泛函分析
附录B多元微分与优化问题
附录C概率与统计
附录DPython入门
参考文献
猜您喜欢