书籍详情

概率与统计:数据科学视角

概率与统计:数据科学视角

作者:王彩霞

出版社:机械工业出版社

出版时间:2022-03-01

ISBN:9787111628941

定价:¥89.00

购买这本书可以去
内容简介
  本书从数据科学视角,详细讲解概率分布、期望值、估计等概率统计知识,广泛使用真实的数据集,同时所有数据分析均由R编码支持。此外,本书包含许多数据科学应用,如主成分分析、混合分布、随机图模型、隐马尔科夫模型、线性回归、逻辑回归和神经网络等。
作者简介
  诺曼·马特罗夫(Norman Matloff)是加州大学戴维斯分校计算机科学专业教授,并曾担任该校统计学专业教授。他是 Journal of Statistical Software和The R Journal的编委会成员。他的著作Statistical Regression and Classification: From Linear Models to Machine Learning曾入选2017年国际Ziegel奖。他还是该校杰出教学奖的获得者。
目录
前言
作者简介
部分 概率论基础
第1章 基本的概率模型2
 1.1 示例:公共汽车客流量2
 1.2 “笔记本”视图:重复实验的概念3
  1.2.1 理论方法3
  1.2.2 更直观的方法3
 1.3 我们的定义4
 1.4 “邮寄筒”7
 1.5 示例:公共汽车客流量(续)7
 1.6 示例:ALOHA网络9
  1.6.1 ALOHA网络模型总结10
  1.6.2 ALOHA网络计算10
 1.7 笔记本环境中的ALOHA12
 1.8 示例:一个简单的棋盘游戏13
 1.9 贝叶斯法则14
  1.9.1 总则14
  1.9.2 示例:文档分类15
 1.10 随机图模型15
  1.10.1 示例:择优连接模型16
 1.11 基于组合数学的计算16
  1.11.1 5张牌中哪一种情况更有可能:一张国王还是两张红心16
  1.11.2 示例:学生的随机分组17
  1.11.3 示例:彩票17
  1.11.4 示例:数字之差18
  1.11.5 多项式系数19
  1.11.6 示例:打桥牌时得到4张A的概率19
 1.12 练习20
第2章 蒙特卡罗模拟22
 2.1 示例:掷骰子22
  2.1.1 次改进22
  2.1.2 第二次改进23
  2.1.3 第三次改进24
 2.2 示例:骰子问题24
 2.3 使用runif()模拟事件25
 2.4 示例:公共汽车客流量(续)25
 2.5 示例:棋盘游戏(续)25
 2.6 示例:断杆26
 2.7 我们应该运行模拟多长时间26
 2.8 计算补充26
  2.8.1 replicate()函数的更多信息26
 2.9 练习27
第3章 离散型随机变量:期望值28
 3.1 随机变量28
 3.2 离散型随机变量28
 3.3 独立的随机变量29
 3.4 示例:蒙提霍尔问题29
 3.5 期望值31
  3.5.1 一般性——不只是离散型随机变量31
  3.5.2 用词不当31
  3.5.3 定义和笔记本视图31
 3.6 期望值的性质32
  3.6.1 计算公式32
  3.6.2 期望值的一些性质33
 3.7 示例:公共汽车客流量35
 3.8 示例:预测产品需求36
 3.9 通过模拟求期望值36
 3.10 赌场、保险公司和“总和使用者”与其他情况相比37
 3.11 数学补充38
  3.11.1 性质E的证明38
 3.12 练习38
第4章 离散型随机变量:方差39
 4.1 方差39
  4.1.1 定义39
  4.1.2 方差概念的核心重要性41
  4.1.3 关于Var(X)大小的直觉41
 4.2 有用的事实42
 4.3 协方差43
 4.4 指示随机变量及其均值和方差44
  4.4.1 示例:图书馆图书归还时间(版)44
  4.4.2 示例:图书馆图书归还时间(第二版)45
  4.4.3 示例:委员会问题中的指示变量45
 4.5 偏度47
 4.6 数学补充47
  4.6.1 切比雪夫不等式的证明47
 4.7 练习48
第5章 离散参数分布族49
 5.1 分布49
  5.1.1 示例:掷硬币直到次出现正面为止49
  5.1.2 示例:两个骰子的和49
  5.1.3 示例:Watts-Strogatz随机图模型50
 5.2 参数分布族51
 5.3 对我们很重要的案例:pmf的参数族51
 5.4 基于伯努利实验的分布51
  5.4.1 几何分布族52
  5.4.2 二项分布族55
  5.4.3 负二项分布族56
 5.5 两种主要的非伯努利模型58
  5.5.1 泊松分布族58
  5.5.2 幂律分布族59
  5.5.3 根据数据拟合泊松和幂律模型60
 5.6 其他示例62
  5.6.1 示例:公共汽车客流量问题…62
  5.6.2 示例:社交网络分析63
 5.7 计算补充63
  5.7.1 R中的图形和可视化63
 5.8 练习64
第6章 连续型概率模型66
 6.1 随机掷镖游戏66
 6.2 单值点的概率为零66
 6.3 现在我们有个问题67
 6.4 解决该问题的方法:累积分布函数67
  6.4.1 累积分布函数67
  6.4.2 既非离散也非连续的分布68
 6.5 密度函数69
  6.5.1 密度函数的性质69
  6.5.2 密度的直观含义70
  6.5.3 期望值71
 6.6 个示例71
 6.7 著名的连续分布参数族72
  6.7.1 均匀分布72
  6.7.2 正态(高斯)分布族73
  6.7.3 指数分布族74
  6.7.4 伽马分布族76
  6.7.5 贝塔分布族77
 6.8 数学补充79
  6.8.1 危险函数79
  6.8.2 指数分布族与泊松分布族的对偶性79
 6.9 计算补充80
  6.9.1 R的integrate()函数80
  6.9.2 从密度函数中抽样的逆方法…80
  6.9.3 从泊松分布中抽样81
 6.10 练习81
第二部分 统计基础
第7章 统计学:序言84
 7.1 本章的重要性84
 7.2 抽样分布84
  7.2.1 随机抽样84
 7.3 样本均值85
  7.3.1 示例:玩具总体85
  7.3.2 X的期望值和方差86
  7.3.3 同样的示例:玩具总体87
  7.3.4 解释87
  7.3.5 笔记本视图88
 7.4 简单随机抽样情况88
 7.5 样本方差89
  7.5.1 σ2的直观估计89
  7.5.2 更易于计算的方法89
  7.5.3 特殊情况:X为指示变量90
 7.6 除以n还是n-190
  7.6.1 统计偏差90
 7.7 “标准误差”的概念91
 7.8 示例:Pima糖尿病研究91
 7.9 别忘了:样本≠总体93
 7.10 模拟问题93
  7.10.1 样本估计93
  7.10.2 无限总体93
 7.11 观测研究9
猜您喜欢

读书导航