书籍详情

机器学习:实用技术指南

机器学习:实用技术指南

作者:(美)詹森·贝尔

出版社:机械工业出版社

出版时间:2018-05-01

ISBN:9787111593379

定价:¥79.00

购买这本书可以去
内容简介
  本书是一本使用机器学习进行实际操作处理数据分析任务的书,全书讨论了机器学习理论及其应用,重点是机器学习在实际生活工作中的应用的。通过阅读本书,读者将了解机器学习的基本知识、常用策略、各种算法、实际应用等。
作者简介
  作者:(美)詹森·贝尔 译者:邹伟 译者:王燕妮詹森·贝尔(Jason Bell),从2002年以来一直研究销售点系统管理与客户忠诚度数据,并且从事软件行业已经超过25年。他是Datasentiment的创始人,该公司帮助企业在全球范围内进行数据采集、处理与洞察。
目录
Contents 目  录
译者序
前言
致谢
第1章 什么是机器学习1
1.1 机器学习的历史1
1.1.1阿兰·图灵1
1.1.2亚瑟·塞缪尔2
1.1.3汤姆 M.米切尔2
1.1.4总结定义2
1.2机器学习的算法类型2
1.2.1监督学习3
1.2.2无监督学习3
1.3人的作用3
1.4机器学习的用途4
1.4.1软件4
1.4.2股票交易4
1.4.3机器人学5
1.4.4医学和医疗5
1.4.5广告业5
1.4.6零售和电子商务6
1.4.7游戏分析7
1.4.8物联网7
1.5机器学习语言8
1.5.1Python8
1.5.2R8
1.5.3Matlab8
1.5.4Scala8
1.5.5Clojure9
1.5.6Ruby9
1.6 本书使用的软件9
1.6.1检查Java版本9
1.6.2Weka 工具包9
1.6.3Mahout10
1.6.4Spring XD10
1.6.5Hadoop11
1.6.6使用集成开发环境11
1.7数据库11
1.7.1加州大学欧文分校机器学习库12
1.7.2Infochimps12
1.7.3Kaggle12
1.8总结12
第2章 筹备机器学习13
2.1机器学习周期13
2.2以问题为先导13
2.3缺少数据14
2.3.1从身边做起14
2.3.2比赛14
2.4一劳永逸的解决方案15
2.5界定机器学习过程15
2.5.1规划15
2.5.2开发16
2.5.3测试16
2.5.4报告16
2.5.5精炼16
2.5.6产品16
2.6建立数据团队17
2.6.1数学和统计学17
2.6.2编程17
2.6.3图形设计17
2.6.4行业知识17
2.7数据处理18
2.7.1使用个人计算机18
2.7.2计算机集群18
2.7.3云服务18
2.8数据存储19
2.8.1物理磁盘19
2.8.2云存储19
2.9数据隐私19
2.9.1文化规范19
2.9.2普遍的期望20
2.9.3用户数据匿名20
2.9.4不要穿过“底线”21
2.10数据质量和清洗21
2.10.1完整性检测22
2.10.2类型检测22
2.10.3长度检测22
2.10.4范围检测22
2.10.5格式检测23
2.10.6进退两难23
2.10.7国家名内包含的内容26
2.10.8数值和日期27
2.10.9有关数据清洗的最后看法28
2.11思考输入数据28
2.11.1原始文本28
2.11.2逗号分隔变量28
2.11.3JSON29
2.11.4YAML30
2.11.5XML31
2.11.6电子表格32
2.11.7数据库32
2.11.8图像33
2.12考虑输出数据33
2.13不要害怕实验33
2.14总结34
第3章 决策树35
3.1决策树基础35
3.1.1决策树的用途35
3.1.2决策树的优点36
3.1.3决策树的局限36
3.1.4相关算法类型36
3.1.5决策树工作原理37
3.2 Weka中的决策树40
3.2.1需求40
3.2.2训练数据41
3.2.3使用Weka创建决策树42
3.2.4为分类器生成Java代码46
3.2.5测试分类器代码49
3.2.6进一步的思考51
3.3总结51
第4章 贝叶斯网络52
4.1从飞行员到回形针52
4.2图论53
4.3概率论54
4.3.1投掷硬币54
4.3.2条件概率54
4.3.3赌博中获胜54
4.4贝叶斯定理55
4.5贝叶斯网络原理57
4.5.1赋值57
4.5.2计算结果58
4.6节点的个数59
4.7利用领域专家的信息59
4.8贝叶斯网络演练59
4.8.1贝叶斯网络中的Java API60
4.8.2设计网络60
4.8.3编程61
4.9总结69
第5章 人工神经网络70
5.1什么是神经网络70
5.2人工神经网络的应用71
5.2.1高频交易71
5.2.2信用分析71
5.2.3数据中心管理71
5.2.4机器人72
5.2.5药效监控72
5.3人工神经网络分解72
5.3.1感知机72
5.3.2激活函数73
5.3.3多层感知机74
5.3.4后向传播算法75
5.4人工神经网络的数据准备76
5.5 Weka中的人工神经网络76
5.5.1新建数据集76
5.5.2将数据载入Weka中78
5.5.3配置多层感知机79
5.5.4训练网络81
5.5.5调整网络83
5.5.6增加测试数据规模83
5.6利用Java实现神经网络84
5.6.1创建项目84
5.6.2实现代码86
5.6.3CSV与Arff文件转换88
5.6.4运行神经网络88
5.7总结89
第6章 关联规则学习90
6.1关联规则学习的应用90
6.1.1Web使用挖掘90
6.1.2啤酒和尿布91
6.2关联规则学习工作原理92
6.2.1支持度92
6.2.2置信度93
6.2.3提升度93
6.2.4确信度93
6.2.5计算步骤94
6.3算法94
6.3.1 Apiori94
6.3.2FP-Growth95
6.4基于购物篮分析的实战95
6.4.1下载原始数据95
6.4.2在Eclipse中搭建工程96
6.4.3建立项目的数据文件97
6.4.4 设置数据99
6.4.5运行Mahout101
6.4.6检查结果103
6.4.7结果整合105
6.4.8进一步开发106
6.5总结106
第7章 支持向量机107
7.1什么是支持向量机107
7.2何处使用支持向量机107
7.3基本分类原则108
7.3.1二分类和多分类108
7.3.2线性分类器109
7.3.3置信度109
7.3.4最大化或最小化寻找直线110
7.4支持向量机如何实现分类110
7.4.1使用线性分类110
7.4.2使用非线性分类112
7.5在Weka中使用支持向量机112
7.5.1安装LibSVM112
7.5.2分类演示113
7.5.3用Java实现LibSVM117
7.6总结122
第8章 聚类123
8.1什么是聚类123
8.2聚类应用123
8.2.1因特网124
8.2.2商业和零售业124
8.2.3执法部门124
8.2.4计算124
8.3聚类模型125
8.3.1k-均值的工作原理125
8.3.2计算一个数据集中聚类的数量126
8.4使用Weka做k-均值聚类127
8.4.1准备数据128
8.4.2工作台方法129
8.4.3命令行方法133
8.4.4编程方法135
8.5总结143
第9章 实时机器学习—使用Spring XD框架144
9.1获取消防水管式的数据144
9.1.1使用实时数据的注意事项144
9.1.2实时系统的使用范围145
9.2
猜您喜欢

读书导航