书籍详情

时间序列数据的特征表示、相似性度量及其应用研究

时间序列数据的特征表示、相似性度量及其应用研究

作者:李海林,郭崇慧 著

出版社:清华大学出版社

出版时间:2022-06-01

ISBN:9787302603528

定价:¥98.00

购买这本书可以去
内容简介
  本书以时间序列数据为研究对象,对时间序列数据的特征表示和相似性度量进行较为深入和系统的研究,讲述了如何从数据特征的不同角度进行数据降维,结合设计相应的相似性度量方法实现时间序列数据挖掘,同时将相关的特征表示和相似性度量方法应用于文本主题、经济金融、情报分析和发动机参数等具体领域。全书分为 11章:第1章对研究的背景和现状进行了分析,解释了为什么要研究时间序列数据的特征表示和相似性度量。第2章至第6章从时间序列数据的不同视角出发,深入浅出地介绍了新的时间序列数据特征表示和相似性度量等预处理方法。第7章到第10章以主题分析、股票预测、文献分析、发动机参数特征识别和故障检测为目标,将时间序列数据挖掘中的特征表示和相似性度量方法应用于解决具体行业中的相关管理科学问题。第11章对研究进行了总结,并提出了研究的创新和未来研究方向。 本书的研究内容主要涉及统计学、计算机科学、经济学和管理学等,适合从事经济金融、电子信息、生物医学、工业与工程等工作的技术人员、管理人员或有志从事相关领域科学研究的本科生、研究生学习或参考。通过阅读和学习本书,读者可以较好地了解时间序列数据挖掘与传统时间序列数据分析的不同,为今后的时间序列数据的相关研究奠定基础。
作者简介
  李海林 ,男,博士 ,教授 ,博士生导师 ,曾任华侨大学工商管理学院院长助理 ,信息管理系主任 ,教务处副处长 ,研究方向为数据科学和创新管理等 ;国家自然科学基金通讯评审专家 ,教育部学位中心研究生学位论文评审专家 ,中国信息经济学会理事会理事 ,中国系统工程学会数据与知识专委会委员 ,泉州市信息化项目评审专家 ;在InformationSciences、Pat-ternRecognition、《系统工程理论与实践》《科学学研究》和《情报学报》等国内外重要刊物 ,以及 SIGKDD、ICDM和PAKDD等国际数据挖掘会议上发表论文70余篇 ,其中大部分被 SSCI、 20多篇论文分别发表在运筹SCI和 EI收录 ,学与管理科学、人工智能和应用数学等领域的 TOP期刊 ,近30篇论文发表在中科院 SCI和SSCI分区 1区和 2区期刊 ;主持 2项国家自然科学基金和 6项省部级项目 ,参与完成其他各类级科研项目 10余项 ;以第一作者身份获福建省“第十二届社会科学优秀成果奖二等奖 ”(政府奖 ),入选福建省 “ABC高层次人才 ”、福建省 “高校新世纪优秀人才支持计划 ”、福建省 “高校杰出青年科研人才培育计划 ”,博士论文被评为辽宁省 “优秀博士学位论文 ”,被评为泉州市第三层次人才 ,连续获得两届华侨大学 “学术英才 ”称号。 郭崇慧 ,男,博士 ,教授 ,博士生导师 ,大连理工大学系统工程研究所所长 ,大数据与智能决策研究中心主任 ,大连市数据科学与知识管理重点实验室主任 ,曾任管理科学与工程学院院长 ;中国系统工程学会常务理事 ,中国管理科学与工程学会常务理事 ,辽宁省数量经济学会常务理事 ,辽宁省运筹学会理事 ,辽宁省自动化学会理事 ,国家自然科学基金委创新研究群体学术骨干 ,《系统工程理论与实践》和《系统工程与电子技术》编委 ; 2007年入选 “辽宁省百千万人才工程 ”人选 ,2011年入选教育部 “新世纪优秀人才支持计划 ”;担 2013年访问悉尼科技大学量子计算与智能系统研究中心 ,任高级研究学者;担任高级研究 2016年访问新泽西州立大学罗格斯商学院,学者;主要研究方向为系统建模与优化、数据挖掘与商务智能、决策理论与方法、知识管理;主持国家自然科学基金面上项目、国家软科学研究计划项目、中国博士后科学基金项目等,参与完成国家973重点基础研究发展项目、国家高科技研究发展计划863项目、国家自然科学基金重大国际合作研究项目、国家自然科学基金重点项目等科研项目10余项;在国内外学术期刊发表论文10余篇,其中SCI收录30余篇,EI收录60余篇;出版著作及教材6部,译著1部。
目录
第1章绪论1
1.1选题背景及研究意义1
1.1.1选题背景2
1.1.2研究意义4
1.2研究现状和已有研究的不足之处7
1.2.1特征表示研究现状8
1.2.2相似性度量研究现状17
1.2.3已有研究的不足之处27
1.3本书研究内容和框架结构29
1.3.1研究内容30
1.3.2框架结构32
第2章基于正交多项式回归系数的特征表示及相似性度量36
2.1正交多项式回归系数特征表示37
2.2拟合效果分析38
2.3相似性度量40
2.4数值实验45
2.4.1拟合误差分析46
2.4.2下界紧凑性及数据剪枝能力47
2.4.3时间序列分类和聚类50
2.5本章小结53
第3章分段聚合特征表示及相似性度量55
3.1分段聚合近似56
3.2基于二维统计特征的分段聚合近似57
3.2.1分段聚合近似的下界性58
3.2.2线性统计特征59
3.2.3非线性统计特征62
3.2.4数值实验63
3.3基于二维形态特征的分段符号聚合近似65
3.3.1形态特征符号聚合近似67
3.3.2相似性度量及算法描述71
3.3.3数值实验73
3.4基于主要形态特征的分段聚合近似74
3.4.1主要形态特征表示75
3.4.2形态特征相似性度量80
3.4.3数值实验82
3.5本章小结89
第4章时间序列分段云模型特征表示及相似性度量91
4.1云模型简介92
4.2时间序列云模型特征表示95
4.2.1时间序列分段云近似96
4.2.2自适应分段云近似98
4.3云模型相似性度量100
4.3.1基于期望曲线的云模型相似度计算方法101
4.3.2基于最大边界曲线的云模型相似度计算方法106
4.4基于云模型的时间序列相似性计算107
4.5实验结果及分析108
4.5.1仿真实验109
4.5.2协同过滤推荐实验110
4.5.3时间序列分类分析112
4.5.4时间序列聚类分析114
4.6本章小结117
第5章不等长时间序列数据的弯曲距离度量118
5.1分段线性近似的导数动态时间弯曲度量118
5.1.1自适应分段线性表示120
5.1.2特征弯曲度量128
5.1.3数值实验129
5.2高效动态时间弯曲相似性搜索方法133
5.2.1高效动态时间弯曲134
5.2.2相似性搜索方法137
5.2.3数值实验140
5.3本章小结142
第6章时间序列数据的异步主成分分析144
6.1研究动机145
6.2主成分分析147
6.3异步主成分分析149
6.4实验评估153
6.4.1模拟数据聚类153
6.4.2UCI和股票数据挖掘158
6.5本章小结161
第7章共现时间序列聚类的主题网络分析163
7.1研究思路163
7.2基于Matrix Profile和社区检测的时间序列聚类方法165
7.2.1相关性度量166
7.2.2网络构建167
7.2.3社区检测168
7.2.4实例与过程170
7.3基于同时段时序相似性的主题网络聚类171
7.3.1主题关系定义172
7.3.2相关性度量173
7.3.3网络构建与划分174
7.4聚类结果与分析176
7.4.1滑动窗口构建网络聚类结果与分析176
7.4.2平均分段构建网络聚类结果与分析179
7.5本章小结181
第8章时间序列矩阵画像的金融数据预测分析182
8.1问题分析182
8.2矩阵画像相关理论185
8.3股票价格波动趋势预测方法188
8.3.1机构交易行为知识库188
8.3.2最佳模式匹配191
8.3.3预测算法193
8.4实验分析195
8.4.1数据收集与处理195
8.4.2预测结果评测标准196
8.4.3实例分析197
8.4.4实验评估201
8.5本章小结207
第9章期刊文献时间序列数据分析209
9.1研究动机209
9.2近邻传播聚类算法212
9.3数据来源与研究思路213
9.4参考文献来源期刊分析214
9.4.1参考文献来源期刊被引数值聚类分析215
9.4.2参考文献来源期刊被引趋势聚类分析218
9.5引证文献来源期刊分析220
9.5.1引证文献来源期刊被引数值聚类分析221
9.5.2引证文献来源期刊被引趋势聚类分析224
9.6本章小结226
第10章发动机参数时间序列数据特征分析与异常检测228
10.1基于形态特征的发动机参数特征识别229
10.1.1数据来源229
10.1.2参数特征识别方法231
10.1.3数值实验234
10.2基于统计特征的发动机故障检测236
10.2.1最不相似模式发现算法237
10.2.2基于非线性统计特征的异常检测238
10.2.3数值实验240
10.3本章小结242
第11章总结与展望244
11.1主要结论244
11.2主要创新点246
11.3研究展望249
猜您喜欢

读书导航