书籍详情
材料数据挖掘方法与应用
作者:陆文聪,李敏杰,纪晓波 著
出版社:化学工业出版社
出版时间:2022-06-01
ISBN:9787122405975
定价:¥128.00
购买这本书可以去
内容简介
《材料数据挖掘方法与应用》详细介绍了材料数据挖掘的研究背景、常用方法、具体步骤和作者团队自主开发的在线计算平台OCPMDM(online computation platform for materials data mining,http:/materials-data-mining.com/ocpmdm/)的应用,重点阐述了OCPMDM在线计算平台在材料设计(钙钛矿型材料、染料敏化太阳能电池材料等)和化工优化(氟橡胶工艺优化等)中的应用。本书方便读者学以致用,读者可以免费利用OCPMDM软件平台,构建并分享材料数据挖掘模型,用于虚拟样本的高通量筛选,加快新材料研发进程。 本书可供材料科学与工程等相关领域科研人员和工程技术人员阅读,亦可作为高等院校材料数据挖掘研究方向师生的教学参考书。
作者简介
暂缺《材料数据挖掘方法与应用》作者简介
目录
第1章 材料数据挖掘综述 001
1.1 材料数据挖掘的研究背景 001
1.1.1 材料数据挖掘与材料设计 004
1.1.2 材料数据挖掘与材料信息学 006
1.1.3 材料数据挖掘与材料基因组工程 008
1.1.4 材料数据挖掘与材料工业优化 011
1.2 材料数据挖掘方法概要 012
1.2.1 材料数据挖掘问题的数学表达 013
1.2.2 材料数据挖掘模型的“过拟合”和“欠拟合”问题 013
1.2.3 材料数据挖掘的常用方法 015
1.2.4 材料数据挖掘的基本流程 019
1.3 材料数据挖掘应用进展 021
1.4 材料数据挖掘发展趋势 023
参考文献 025
第2章 回归分析 029
2.1 回归分析方法概论 029
2.2 线性回归 030
2.2.1 一元线性回归 030
2.2.2 多元线性回归 032
2.2.3 违背基本假设的情况与处理 033
2.3 岭回归 034
2.4 套索算法 036
2.5 偏最小二乘回归 038
2.6 逻辑回归 040
参考文献 042
第3章 统计模式识别 043
3.1 统计模式识别概论 043
3.2 最近邻 045
3.3 主成分分析 046
3.4 多重判别矢量和费歇尔判别矢量 048
3.5 非线性映照 052
3.6 模式识别应用技术 053
3.6.1 最佳投影识别 054
3.6.2 超多面体建模 056
3.6.3 逐级投影建模 056
3.6.4 最佳投影回归 058
3.6.5 模式识别逆投影 061
参考文献 062
第4章 决策树 063
4.1 决策树概论 063
4.2 决策树 064
4.3 随机决策树 066
4.4 随机森林 067
4.5 梯度提升决策树 069
4.6 极限梯度提升算法 071
4.7 快速梯度提升算法 074
参考文献 076
第5章 聚类方法 077
5.1 k均值聚类方法 077
5.2 噪声密度聚类方法 078
5.3 评估指标 079
参考文献 081
第6章 人工神经网络 082
6.1 反向人工神经网络 083
6.2 Kohonen自组织网络 085
参考文献 086
第7章 遗传算法和遗传回归 087
7.1 遗传算法 087
7.2 遗传回归 089
参考文献 092
第8章 支持向量机方法 094
8.1 统计学习理论简介 095
8.1.1 背景 095
8.1.2 原理 095
8.2 支持向量分类算法 097
8.2.1 线性可分情形 097
8.2.2 非线性可分情形 098
8.3 支持向量机的核函数 099
8.4 支持向量回归方法 101
8.4.1 线性回归情形 101
8.4.2 非线性回归情形 102
8.5 支持向量机分类与回归算法的实现 103
8.6 应用前景 104
参考文献 105
第9章 集成学习方法 107
9.1 集成学习算法概述 107
9.2 Boosting算法 110
9.3 AdaBoost算法 111
9.4 Bagging算法 113
参考文献 114
第10章 特征选择方法和应用 116
10.1 特征变量筛选方法概论 116
10.2 过滤式 118
10.2.1 方差选择法 118
10.2.2 相关系数法 118
10.2.3 最大信息系数 119
10.2.4 最大相关最小冗余 120
10.2.5 卡方检验 121
10.2.6 Relief 121
10.3 封装式 122
10.3.1 全局最优搜索 122
10.3.2 启发式搜索 123
10.3.3 随机搜索 124
10.4 嵌入式 124
10.5 小结 125
参考文献 126
第11章 材料数据挖掘在线计算平台 128
11.1 材料数据挖掘在线计算平台技术简介 128
11.1.1 OCPMDM平台架构 129
11.1.2 OCPMDM平台技术简介 130
11.1.3 分布式计算简介与使用 131
11.2 材料数据挖掘在线计算平台功能介绍 132
11.2.1 机器学习算法 133
11.2.2 材料描述符填充 134
11.2.3 数据特征筛选 134
11.2.4 智能建模 135
11.2.5 钙钛矿材料高通量虚拟筛选 135
11.2.6 模型分享 135
11.3 材料数据挖掘在线计算平台应用案例 136
11.3.1 数据来源 136
11.3.2 研究流程 137
11.3.3 结果与讨论 137
11.4 小结 145
参考文献 146
第12章 钙钛矿型材料的数据挖掘 148
12.1 钙钛矿型材料数据挖掘概论 148
12.2 钙钛矿型材料居里温度的数据挖掘 149
12.2.1 数据集 150
12.2.2 特征变量筛选 151
12.2.3 参数优化 152
12.2.4 模型的评价 154
12.2.5 模型的检验 156
12.2.6 虚拟筛选 156
12.3 钙钛矿型材料比表面积的数据挖掘 158
12.3.1 数据集 159
12.3.2 特征变量筛选 160
12.3.3 SVR模型的建立与留一法检验 162
12.3.4 与其他算法的结果比较 165
12.3.5 SVR外部测试集验证 165
12.3.6 高通量筛选 167
12.3.7 模型分享 169
12.3.8 模型的模式识别解释 169
12.3.9 模型的敏感性分析 170
12.4 小结 172
参考文献 173
第13章 染料敏化太阳能电池材料的数据挖掘 176
13.1 概述 176
13.1.1 染料敏化太阳能电池 176
13.1.2 染料敏化剂及其数据挖掘研究现状 177
13.1.3 N-P类敏化剂研究现状 179
13.2 N-P类敏化剂的数据挖掘 179
13.2.1 数据集与特征变量的计算 180
13.2.2 特征变量的筛选和建模 181
13.2.3 模型的验证 184
13.3 分子设计与性能预报 185
13.3.1 特征变量的解释 185
13.3.2 分子设计与PCE预报 187
13.4 量化验证 189
13.4.1 计算方法 189
13.4.2 电子结构 191
13.4.3 吸收光谱 194
13.4.4 染料和TiO2络合物 195
13.4.5 综合效率 196
13.5 小结 199
参考文献 200
第14章 高分子材料的数据挖掘 204
14.1 概述 204
14.1.1 高分子材料数据挖掘研究现状 205
14.1.2 高分子指纹描述符 206
14.2 高分子材料设计算法 207
14.2.1 遗传算法 207
14.2.2 贝叶斯算法 208
14.3 高分子禁带宽度的数据挖掘 210
14.3.1 研究背景 210
14.3.2 数据集 210
14.3.3 DFT方法探索 211
14.3.4 特征变量筛选 212
14.3.5 模型筛选 212
14.3.6 SVC模型的建立与验证 215
14.3.7 特征相关性分析 216
14.3.8 特征敏感性分析 218
14.3.9 模型分享 219
14.3.10 分子设计 219
14.4 小结 221
参考文献 221
第15章 基于数据挖掘的氟橡胶门尼黏度优化控制 223
15.1 研究背景 223
15.2 研究思路 225
15.3 研究内容 225
15.4 氟橡胶生产优化控制软件BDMOS介绍 227
15.5 BDMOS软件具体功能 228
15.5.1 数据导入 228
15.5.2 统计信息 230
15.5.3 变量重要性分析 234
15.5.4 数据挖掘模型 234
15.6 氟橡胶简介 239
15.7 氟橡胶生产数据挖掘 242
15.7.1 数据集收集 242
15.7.2 模型建立 245
15.7.3 模型检验 246
15.8 小结 248
参考文献 249
索引 250
1.1 材料数据挖掘的研究背景 001
1.1.1 材料数据挖掘与材料设计 004
1.1.2 材料数据挖掘与材料信息学 006
1.1.3 材料数据挖掘与材料基因组工程 008
1.1.4 材料数据挖掘与材料工业优化 011
1.2 材料数据挖掘方法概要 012
1.2.1 材料数据挖掘问题的数学表达 013
1.2.2 材料数据挖掘模型的“过拟合”和“欠拟合”问题 013
1.2.3 材料数据挖掘的常用方法 015
1.2.4 材料数据挖掘的基本流程 019
1.3 材料数据挖掘应用进展 021
1.4 材料数据挖掘发展趋势 023
参考文献 025
第2章 回归分析 029
2.1 回归分析方法概论 029
2.2 线性回归 030
2.2.1 一元线性回归 030
2.2.2 多元线性回归 032
2.2.3 违背基本假设的情况与处理 033
2.3 岭回归 034
2.4 套索算法 036
2.5 偏最小二乘回归 038
2.6 逻辑回归 040
参考文献 042
第3章 统计模式识别 043
3.1 统计模式识别概论 043
3.2 最近邻 045
3.3 主成分分析 046
3.4 多重判别矢量和费歇尔判别矢量 048
3.5 非线性映照 052
3.6 模式识别应用技术 053
3.6.1 最佳投影识别 054
3.6.2 超多面体建模 056
3.6.3 逐级投影建模 056
3.6.4 最佳投影回归 058
3.6.5 模式识别逆投影 061
参考文献 062
第4章 决策树 063
4.1 决策树概论 063
4.2 决策树 064
4.3 随机决策树 066
4.4 随机森林 067
4.5 梯度提升决策树 069
4.6 极限梯度提升算法 071
4.7 快速梯度提升算法 074
参考文献 076
第5章 聚类方法 077
5.1 k均值聚类方法 077
5.2 噪声密度聚类方法 078
5.3 评估指标 079
参考文献 081
第6章 人工神经网络 082
6.1 反向人工神经网络 083
6.2 Kohonen自组织网络 085
参考文献 086
第7章 遗传算法和遗传回归 087
7.1 遗传算法 087
7.2 遗传回归 089
参考文献 092
第8章 支持向量机方法 094
8.1 统计学习理论简介 095
8.1.1 背景 095
8.1.2 原理 095
8.2 支持向量分类算法 097
8.2.1 线性可分情形 097
8.2.2 非线性可分情形 098
8.3 支持向量机的核函数 099
8.4 支持向量回归方法 101
8.4.1 线性回归情形 101
8.4.2 非线性回归情形 102
8.5 支持向量机分类与回归算法的实现 103
8.6 应用前景 104
参考文献 105
第9章 集成学习方法 107
9.1 集成学习算法概述 107
9.2 Boosting算法 110
9.3 AdaBoost算法 111
9.4 Bagging算法 113
参考文献 114
第10章 特征选择方法和应用 116
10.1 特征变量筛选方法概论 116
10.2 过滤式 118
10.2.1 方差选择法 118
10.2.2 相关系数法 118
10.2.3 最大信息系数 119
10.2.4 最大相关最小冗余 120
10.2.5 卡方检验 121
10.2.6 Relief 121
10.3 封装式 122
10.3.1 全局最优搜索 122
10.3.2 启发式搜索 123
10.3.3 随机搜索 124
10.4 嵌入式 124
10.5 小结 125
参考文献 126
第11章 材料数据挖掘在线计算平台 128
11.1 材料数据挖掘在线计算平台技术简介 128
11.1.1 OCPMDM平台架构 129
11.1.2 OCPMDM平台技术简介 130
11.1.3 分布式计算简介与使用 131
11.2 材料数据挖掘在线计算平台功能介绍 132
11.2.1 机器学习算法 133
11.2.2 材料描述符填充 134
11.2.3 数据特征筛选 134
11.2.4 智能建模 135
11.2.5 钙钛矿材料高通量虚拟筛选 135
11.2.6 模型分享 135
11.3 材料数据挖掘在线计算平台应用案例 136
11.3.1 数据来源 136
11.3.2 研究流程 137
11.3.3 结果与讨论 137
11.4 小结 145
参考文献 146
第12章 钙钛矿型材料的数据挖掘 148
12.1 钙钛矿型材料数据挖掘概论 148
12.2 钙钛矿型材料居里温度的数据挖掘 149
12.2.1 数据集 150
12.2.2 特征变量筛选 151
12.2.3 参数优化 152
12.2.4 模型的评价 154
12.2.5 模型的检验 156
12.2.6 虚拟筛选 156
12.3 钙钛矿型材料比表面积的数据挖掘 158
12.3.1 数据集 159
12.3.2 特征变量筛选 160
12.3.3 SVR模型的建立与留一法检验 162
12.3.4 与其他算法的结果比较 165
12.3.5 SVR外部测试集验证 165
12.3.6 高通量筛选 167
12.3.7 模型分享 169
12.3.8 模型的模式识别解释 169
12.3.9 模型的敏感性分析 170
12.4 小结 172
参考文献 173
第13章 染料敏化太阳能电池材料的数据挖掘 176
13.1 概述 176
13.1.1 染料敏化太阳能电池 176
13.1.2 染料敏化剂及其数据挖掘研究现状 177
13.1.3 N-P类敏化剂研究现状 179
13.2 N-P类敏化剂的数据挖掘 179
13.2.1 数据集与特征变量的计算 180
13.2.2 特征变量的筛选和建模 181
13.2.3 模型的验证 184
13.3 分子设计与性能预报 185
13.3.1 特征变量的解释 185
13.3.2 分子设计与PCE预报 187
13.4 量化验证 189
13.4.1 计算方法 189
13.4.2 电子结构 191
13.4.3 吸收光谱 194
13.4.4 染料和TiO2络合物 195
13.4.5 综合效率 196
13.5 小结 199
参考文献 200
第14章 高分子材料的数据挖掘 204
14.1 概述 204
14.1.1 高分子材料数据挖掘研究现状 205
14.1.2 高分子指纹描述符 206
14.2 高分子材料设计算法 207
14.2.1 遗传算法 207
14.2.2 贝叶斯算法 208
14.3 高分子禁带宽度的数据挖掘 210
14.3.1 研究背景 210
14.3.2 数据集 210
14.3.3 DFT方法探索 211
14.3.4 特征变量筛选 212
14.3.5 模型筛选 212
14.3.6 SVC模型的建立与验证 215
14.3.7 特征相关性分析 216
14.3.8 特征敏感性分析 218
14.3.9 模型分享 219
14.3.10 分子设计 219
14.4 小结 221
参考文献 221
第15章 基于数据挖掘的氟橡胶门尼黏度优化控制 223
15.1 研究背景 223
15.2 研究思路 225
15.3 研究内容 225
15.4 氟橡胶生产优化控制软件BDMOS介绍 227
15.5 BDMOS软件具体功能 228
15.5.1 数据导入 228
15.5.2 统计信息 230
15.5.3 变量重要性分析 234
15.5.4 数据挖掘模型 234
15.6 氟橡胶简介 239
15.7 氟橡胶生产数据挖掘 242
15.7.1 数据集收集 242
15.7.2 模型建立 245
15.7.3 模型检验 246
15.8 小结 248
参考文献 249
索引 250
猜您喜欢