书籍详情

非参数统计(基于Python)

非参数统计(基于Python)

作者:王星 著

出版社:中国人民大学出版社

出版时间:2022-06-01

ISBN:9787300301495

定价:¥49.00

购买这本书可以去
内容简介
  非参数统计是统计学和数据科学的重要分支领域。本书作为该领域的基础教材,其特点体现在以下几方面:1.针对性强。本书针对数据分析专业的特点和需要,阐述非参数统计的基本概念、理论、方法和编程,重点从非受控观察数据对参数推断知识的需要角度出发,将统计推断知识、理论和方法与反事实复杂场景因果关系的解读与判断问题相结合,应用于稳健估计、局部模式、严格证据的信息提取任务中。2.通用性强。适用于Python技术数据管理人才培养。增加Python技术的应用内容,编写了Python综合程序,降低了统计理论学习难度,增强了技术的可嵌入性;自主研发的精确分析求解程序,大大补充了Python中小数据推断程序的不足,计算的便利性大幅提升,适用于Python自动化测试、运维、数据分析等多种高端数据管理岗位的嵌入式学习需求。3.内容新颖。顺应人工智能时代发展和数据分析大环境的变化,对特征工程有效降噪及控制错误发现率等方面的内容作了阐述与分析,针对深度学习对图像应用的需求增加,增加了深度学习的内容。
作者简介
  王星 中国人民大学统计学院教授,北京师范大学数学本科与硕士,中国人民大学统计学博士。国家社科基金重点项目负责人,《中国大百科全书》第三版统计学卷编委。在《统计研究》《中国人民大学学报》《数理统计与管理》和JAMA等刊物发表多篇论文。主要研究方向包括稀疏网络挖掘模型、高维复杂数据统计学习、深度学习等。主要著作和译作包括《非参数统计》《大数据分析:方法与应用》《人文社会科学文献网络知识模型与应用》《统计学习导论一基于R应用》等。讲授课程包括非参数统计、大数据分析、机器学习方法等。曾获北京市高等教育教学成果奖二等奖、第十届全国统计科学研究优秀成果奖二等奖、全国应用统计案例大赛一等奖指导教师等学术奖励;开设非参数统计MOOC课程。
目录
第 1章 基本概念
1.1非参数统计的概念与产生
1.1.1 非参数统计的研究对象
1.1.2 非参数统计简史
1.2假设检验回顾
1.3经验分布和分布探索
1.3.1 经验分布
1.3.2 生存函数
1.4检验的相对效率
1.5分位数和非参数估计
1.5.1 顺序统计量
1.5.2 分位数的定义
1.5.3 分位数的估计
1.5.4 分位数的图形表示
1.6秩检验统计量
1.6.1 无重复数据的秩及性质
1.6.2 带结数据的秩及性质
1.7 U统计量
1.7.1 单一样本的U统计量和主要特征
1.7.2 两样本 U检验统计量和分布
习题
第 2章单变量位置推断问题
2.1符号检验和分位数推断
2.1.1基本概念
2.1.2大样本的检验方法
2.1.3符号检验在配对样本比较中的应用
2.1.4分位数检验――符号检验的推广
2.2 Cox-Stuart趋势存在性检验
2.2.1最优权重Cox-Stuart统计量基本原理
2.2.2无权重Cox-Stuart统计量
2.3随机游程检验
2.3.1两类随机游程检验
2.3.2三类及多类游程检验
2.4 Wilcoxon符号秩检验
2.4.1基本概念
2.4.2 Wilcoxon符号秩检验和抽样分布
2.5估计量的稳健性评价
2.5.1敏感曲线
2.5.2影响函数
2.5.3失效点
2.6单组数据的位置参数置信区间估计
2.6.1顺序统计量位置参数置信区间估计
2.6.2基于方差估计法的位置参数置信区间估计
2.7正态记分检验
2.8分布的一致性检验
2.8.1 χ2拟合优度检验
2.8.2 Kolmogorov-Smirnov正态性检验
2.8.3 Liliefor正态分布检验
2.9单一总体渐近相对效率比较
习题
第3章 两独立样本数据的位置和尺度推断 ?
3.1 Brown-Mood中位数检验
3.1.1假设检验问题
3.1.2大样本检验
3.2 Wilcoxon-Mann-Whitney秩和检验
3.2.1无结点Wilcoxon-Mann-Whitney秩和检验 ?
3.2.2带结点时的计算公式
3.2.3 MX . MY的点估计和区间估计
3.3 Mann-Whitney U统计量与ROC曲线
3.4置换检验
3.5 Mood方差检验
3.6 Moses方差检验
习题
第4章 多组数据位置推断
4.1试验设计和方差分析的基本概念回顾
4.2多重检验问题
4.2.1 FDR控制基本原理
4.2.2 FDR的相关讨论
4.3高阶鉴定法(HC)
4.4 Kruskal-Wallis单因素方差分析
4.4.1 Kruskal-Wallis检验的基本原理
4.4.2有结点的检验
4.5 Jonckheere-Terpstra检验
4.5.1无结点Jonckheere-Terpstra检验
4.5.2带结点的Jonkheere-Terpstra检验
4.6 Friedman秩方差分析法
4.6.1 Friedman检验的基本原理
4.6.2 Hollander-Wolfe两处理间比较
4.7随机区组数据的调整秩和检验
4.8 Cochran检验
4.9 Durbin不完全区组分析法习题
第5章 分类数据的关联分析
5.1 r×s列联表和χ2独立性检验
5.2 χ2齐性检验
5.3 Fisher精确性检验
5.4 McNemar检验
5.5 Mantel-Haenszel检验
5.6关联规则
5.6.1关联规则基本概念
5.6.2 Apriori算法
5.7 Ridit检验法
5.7.1 Ridit得分的计算和假设检验
5.7.2 根据置信区间分组
5.8对数线性模型
5.8.1泊松回归
5.8.2对数线性模型的基本概念
5.8.3模型的设计矩阵
5.8.4模型的估计和检验
5.8.5高维对数线性模型和独立性
习题
第 6章 秩相关和稳健回归 ?
6.1 Spearman秩相关检验
6.2 Kendallτ相关检验
6.3多变量Kendall协和系数检验
6.4 Kappa一致性检验
6.5 HBR基于秩的稳健回归
6.5.1基于秩的R估计
6.5.2假设检验
6.5.3多重决定系数 CMD
6.5.4回归诊断
6.6中位数回归系数估计法
6.6.1 Brown-Mood方法
6.6.2 Theil方法
6.6.3关于α和 β的检验
6.7线性分位回归模型习题
第7章 非参数密度估计
7.1直方图密度估计
7.1.1基本概念
7.1.2理论性质和最优带宽
7.1.3多维直方图 ?
7.2核密度估计
7.2.1核函数的基本概念
7.2.2理论性质和带宽
7.2.3置信带和中心极限定理
7.2.4多维核密度估计
7.2.5贝叶斯决策和非参数密度估计
7.3 k近邻估计
习题
第8章 非参数回归
8.1核回归光滑模型
8.2局部多项式回归
8.2.1局部线性回归
8.2.2局部多项式回归的基本原理
8.3 LOWESS稳健回归
8.4 k近邻回归
8.4.1 k近邻估计
8.4.2 k近邻核估计
8.5正交序列回归
8.6罚最小二乘法
8.7样条回归
8.7.1模型
8.7.2 样条回归模型的节点
8.7.3 常用的样条基函数
8.7.4 样条模型自由度
习题
第9章 数据挖掘与机器学习
9.1分类一般问题
9.2线性判别
IR-LDA基本原理
9.3 Logistic回归
9.3.1 Logistic回归模型
9.3.2 Logistic回归模型的极大似然估计
9.3.3 Logistic回归和线性判别函数LDA的比较
9.4 k近邻
9.4.1 参数选择与维数灾难
9.4.2 k近邻与线性模型之间的比较
9.5决策树
9.5.1决策树的基本概念
9.5.2 CART
9.5.3决策树的剪枝
9.5.4回归树
9.5.5决策树的特点
9.6 Boosting
9.6.1 Boosting提升方法
9.6.2 AdaBoost.M1算法
9.7支持向量机
9.7.1最大分类间隔
9.7.2支持向量机问题的求解
9.7.3支持向量机的核方法
9.8随机森林
9.8.1随机森林算法的定义 ?
9.8.2随机森林算法的性质
9.8.3如何确定随机森林算法中树的节点分裂变量
9.8.4随机森林的回归算法
9.8.5有关随机森林算法的一些评价
9.9 MARS
9.9.1 MARS与 CART的联系
9.9.2 MARS的一些性质
9.10深度学习
9.10.1神经网络
9.10.2卷积神经网络
习题
附录 Python基础
参考文献
猜您喜欢

读书导航