数据库挖掘/数据仓库
-
粒度计算在数据挖掘中的应用研究张霞 著张霞的这本《粒度计算在数据挖掘中的应用研究》对模糊粒度计算在文本软聚类中的应用进行了深入研究,提出了一种基于模糊粒度计算的聚类方法,并且利用该聚类方法对K-means算法进行了优化。基于模糊粒度计算的聚类是通过归一化的距离函数将聚类问题映射到距离空间,调节粒度产生对文本集合D的动态聚类划分。动态聚类既可以作为一个单独的聚类结果,也可以作为其他算法的一个预处理步骤。K-means算法是一种经典的聚类算法,速度快、消耗资源小,但是算法对初始聚类中心点敏感,容易陷入局部最小值。《粒度计算在数据挖掘中的应用研究》将基于模糊粒度计算的聚类方法作为K-means算法的预处理步骤,实验结果证明,这种预处理有效地消除了K-means算法的初始值敏感问题,优化了K-means算法。
-
标准信息挖掘刘华 著随着互联网及相应信息技术的广泛应用,标准信息检索也相应地发生变化,网络作为检索平台。信息化建社在文献管理中的作用越来越大,各级图书馆、档案馆、资料室等文献机构均需进行信息化建设,刘华所著的《标准信息挖掘——理论、方法与应用》提供了具体的方法,介绍了标准文献的信息挖掘和信息处理的理论、方法、模型及其应用等。
-
智能Web算法阿稳 著《智能Web算法》涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在Web应用中的角色及要注意的问题。除了第1章的概要性介绍以及第7章对所有技术的整合应用外,第2~6章以代码示例的形式分别对这五类算法进行了介绍。
-
数据仓库与数据挖掘技术张兴会 编著数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。《数据仓库与数据挖掘技术》系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在SQL 2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。《数据仓库与数据挖掘技术》可以作为计算机类、信息类等相关专业本科生数据挖掘课程的教材,也可以作为其他专业技术人员的自学参考书。
-
数据可视化之美(美) Julie Steele Noah Iliinsky 编,祝洪凯,李妹芳 译可视化是数据描述的图形表示,旨在一目了然地揭示数据中的复杂信息。可视化的典型如纽约地铁图和人脑图。成功的可视化的美丽之处既在于其艺术设计,也在于其通过对细节的优雅展示,能够有效地产生对数据的洞察和新的理解。在本书中,20多位可视化专家包括艺术家、设计师、评论家、科学家、分析师、统计学家等,展示了他们如何在各自的学科领域内开展项目。他们共同展示了可视化所能实现的功能以及如何使用它来改变世界。在《数据可视化之美》中,你将:·通过简单的可视化实践探索讲故事的重要性。·了解颜色如何传达我们尚未充分意识到而大脑已经识别出的信息。·发现我们购买的书籍和我们的交际圈如何揭示内心的自我。·通过对民航交通的可视化探索识别航空旅行的混乱的一种方法。·揭秘研究人员如何调查未知问题,包括从最初的草图到发表的论文。
-
数据挖掘技术与应用陈燕 编著《数据挖掘技术与应用》系统详细地阐述了数据挖掘产生的背景、技术、多种相关方法及具体应用,主要内容包括数据挖掘概述,数据采集、集成与预处理技术,多维数据分析与组织,预测模型研究与应用,关联规则模型及应用,聚类分析方法与应用,粗糙集方法与应用,遗传算法与应用,基于模糊理论的模型与应用,灰色系统理论与方法,基于数据挖掘的知识推理。《数据挖掘技术与应用》可作为管理科学与工程、信息科学与技术、应用数学等相关专业高年级本科生和研究生的数据仓库、数据挖掘及知识管理等相关课程的教材或参考资料,同时本书有助于相关的专业研究人员提升数据挖掘的枝巧和开拓新的研究方向。
-
数据挖掘技术及其应用杨杰 等编著《数据挖掘技术及其应用(精)》(作者杨杰、姚莉秀)系统地讲述了数据挖掘的基本概念和基本原理,并列举了在相应领域具有参考价值的算法及其改进和应用,是作者多年来从事教学和科研实践的成果。全书共9章,主要内容有:数据挖掘的基本概念和原理,数据预处理,各种分类、聚类和关联规则提取算法,以及在生物信息学、材料学中的实际应用案例。 《数据挖掘技术及其应用(精)》可用作计算机专业本?高年级学生或研究生的教材或参考书,也可供从事计算机信息处理、数据挖掘、工业优化等有关方面工作的科技人员参考。
-
数据挖掘算法与Clementine实践熊平 著《数据挖掘算法与Clementine实践》主要介绍了几种最成熟的数据挖掘方法,并针对每种方法,介绍了应用最广泛的几种实现算法。书中以Clementine12.0为平台,用实例介绍了每种算法的具体应用。全书各章分别介绍了数据挖掘和Clementine软件、决策树分类方法(包括ID3、C4.5、C5.0、CART等算法)、聚类分析方法(包括K-Means算法和TwoStep算法)、关联规则挖掘方法(包括Apriori算法、CARMA算法和序列模式挖掘算法)、数据筛选算法(包括特征选择算法和异常检测算法)、回归分析方法(包括线性回归算法和二项Logistic回归)、神经网络构建方法(包括多层感知器网络、RBF网络以及Kohonen网络的构建算法)、时间序列分析方法(包括指数平滑法和ARIMA模型构建方法)。
-
数据挖掘方法与模型(美)拉罗斯 著,刘燕权 等译《数据挖掘方法与模型》分为7章,第1章是对降维方法的介绍,这是数据挖掘技术的一个先决条件;第2章至第6章为经典的数据挖掘算法和技术,包括一元回归模型、多元回归模型、逻辑回归模型、贝叶斯网络分析以及遗传算法,通过实际案例引导读者由已预处理的数据使用不同的挖掘技术从而得出所需结论;第7章为基于数据挖掘过程模型上的多个案例研究,通过多个领域的案例来阐述算法和技术是如何被运用的。《数据挖掘方法与模型》可作为数据挖掘课程教学用书,适用于高年级本科生和研究生的教学,也可供科研人员参考使用。当下,由于强大的数据挖掘软件平台很容易获得,草率地使用数据挖掘方法和技术将导致挖掘的结果混淆难解。这种失误往往源自盲目使用“黑盒子”方法进行数据挖掘,而最好的避免途径就是使用“自盒子”方法,理解隐藏在软件背后的算法和统计模型结构。
-
知识发现史忠植 著知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据资源中发现知识宝藏,将为知识创新和知识经济的发展作出贡献。《知识发现》全面而又系统地介绍了知识发现的方法和技术,反映了当前知识发现研究的最新成果和进展。全书共分15章。第1章是绪论,概述知识发现的重要概念和发展过程。下面三章重点讨论分类问题,包括决策树、支持向量机和迁移学习。第5章阐述聚类分析。第6章是关联规则。第7章讨论粗糙集和粒度计算。第8章介绍神经网络,书中着重介绍几种实用的算法。第9章探讨贝叶斯网络。第10章讨论隐马尔可夫模型。第11章探讨图挖掘。第12章讨论进化计算和遗传算法。第13章探讨分布式知识发现,它使海量数据挖掘成为可能。最后两章以web知识发现、认知神经科学为例,介绍知识发现的应用。书中内容新颖,认真总结了作者的科研成果,取材国内外最新资料,反映了当前该领域的研究水平。论述力求概念清晰,表达准确,算法丰富,突出理论联系实际,富有启发性。《知识发现》可以用作高等院校有关专业的研究生和高年级本科生的知识发现、数据挖掘、机器学习等课程教材,也可供从事知识发现、数据挖掘、机器学习、智能信息处理、模式识别、智能控制研究和知识管理的科技人员阅读参考。