书籍详情
Scikit-learn机器学习高级进阶
作者:潘风文,黄春芳
出版社:化学工业出版社
出版时间:2023-01-01
ISBN:9787122422620
定价:¥89.00
购买这本书可以去
内容简介
本书是《Scikit-learn机器学习详解》(潘风文编著)的进阶篇,讲解了Sklearn(Scikit-learn)机器学习框架的各种高级应用技术,包括数据集导入工具、集成学习、模型选择和交叉验证、异常检测、管道、 信号分解、模型持久化以及Sklearn系统高级配置。通过本书的学习,读者可快速掌握Sklearn框架的高级知识,迈入人工智能殿堂的大门。 本书适合有志于从事机器学习、人工智能技术开发的人员或爱好者使用,也可作为相关专业的教材。
作者简介
无
目录
1 机器学习概述 1 1.1 有监督学习2 1.2 无监督学习3 1.3 半监督学习3 1.4 Sklearn概述4 2 数据集导入工具 6 2.1 通用数据集导入API7 2.1.1 数据集加载器7 2.1.2 数据集提取器8 2.1.3 数据集生成器10 2.1.4 文件导入方法11 2.2 专用数据集导入API14 2.2.1 加载样本图像数据集14 2.2.2 加载svmlight/libsvm格式数据集15 2.2.3 从openml.org 下载数据集16 2.3 加载外部数据集16 2.3.1 列表式数据读取16 2.3.2 多媒体文件读取17 3 集成学习 18 3.1 自助抽样(bootstrap)19 3.2 自助聚合算法(bagging)20 3.2.1 标准自助聚合算法(Bagging)21 3.2.2 随机森林(Random Forest)29 3.2.3 极端随机树(Extremely randomized trees)30 3.3 加速提升算法(boosting)30 3.3.1 自适应提升算法(Adaboost)30 3.3.2 梯度提升树算法(GBDT)38 3.4 投票集成算法(voting)49 3.5 堆栈泛化(stacking)56 4 模型选择和交叉验证 62 4.1 交叉验证评估器64 4.1.1 交叉验证64 4.1.2 交叉验证生成器66 4.1.3 使用交叉验证70 4.2 度量指标和评估(评分)75 4.2.1 评分参数scoring的设置76 4.2.2 哑分类评估器和哑回归评估器86 4.3 模型超参数调优90 4.3.1 穷尽网格超参数搜索91 4.3.2 随机超参数搜索99 4.3.3 非暴力参数搜索方法101 4.3.4 贝叶斯优化103 4.4 验证曲线104 4.4.1 交叉验证曲线105 4.4.2 学习曲线108 5 异常检测 115 5.1 新颖点检测117 5.2 离群点检测123 5.2.1 椭圆包络线算法123 5.2.2 孤立森林算法129 5.2.3 局部离群点因子算法130 6 管道 138 6.1 概念介绍139 6.1.1 评估器(estimator)139 6.1.2 转换器(transformer)140 6.1.3 管道(pipeline)141 6.2 管道机制概述142 6.3 中间评估器及子管道148 6.3.1 获取中间评估器148 6.3.2 获取子管道对象149 6.3.3 设置评估器参数150 6.4 特征聚合转换器150 6.5 列转换机制154 6.5.1 数据泄露154 6.5.2 列转换器155 6.6 模型选择162 7 信号分解 164 7.1 主成分分析PCA165 7.2 核主成分分析KPCA173 7.3 字典学习180 7.3.1 预置字典编码180 7.3.2 通用字典学习186 7.4 因子分析189 7.5 其他信号分解194 7.5.1 独立成分分析195 7.5.2 非负矩阵分解196 7.5.3 隐含狄利克雷分布199 8 模型持久化 200 8.1 针对Python对象的序列化201 8.1.1 使用模块pickle序列化201 8.1.2 使用模块joblib序列化204 8.2 模型互操作方式205 9 Sklearn系统配置 210 9.1 系统环境变量211 9.2 运行时环境变量211 后记 215
猜您喜欢