数据库挖掘/数据仓库
-
数据挖掘算法与Clementine实践熊平 著《数据挖掘算法与Clementine实践》主要介绍了几种最成熟的数据挖掘方法,并针对每种方法,介绍了应用最广泛的几种实现算法。书中以Clementine12.0为平台,用实例介绍了每种算法的具体应用。全书各章分别介绍了数据挖掘和Clementine软件、决策树分类方法(包括ID3、C4.5、C5.0、CART等算法)、聚类分析方法(包括K-Means算法和TwoStep算法)、关联规则挖掘方法(包括Apriori算法、CARMA算法和序列模式挖掘算法)、数据筛选算法(包括特征选择算法和异常检测算法)、回归分析方法(包括线性回归算法和二项Logistic回归)、神经网络构建方法(包括多层感知器网络、RBF网络以及Kohonen网络的构建算法)、时间序列分析方法(包括指数平滑法和ARIMA模型构建方法)。 -
数据挖掘方法与模型(美)拉罗斯 著,刘燕权 等译《数据挖掘方法与模型》分为7章,第1章是对降维方法的介绍,这是数据挖掘技术的一个先决条件;第2章至第6章为经典的数据挖掘算法和技术,包括一元回归模型、多元回归模型、逻辑回归模型、贝叶斯网络分析以及遗传算法,通过实际案例引导读者由已预处理的数据使用不同的挖掘技术从而得出所需结论;第7章为基于数据挖掘过程模型上的多个案例研究,通过多个领域的案例来阐述算法和技术是如何被运用的。《数据挖掘方法与模型》可作为数据挖掘课程教学用书,适用于高年级本科生和研究生的教学,也可供科研人员参考使用。当下,由于强大的数据挖掘软件平台很容易获得,草率地使用数据挖掘方法和技术将导致挖掘的结果混淆难解。这种失误往往源自盲目使用“黑盒子”方法进行数据挖掘,而最好的避免途径就是使用“自盒子”方法,理解隐藏在软件背后的算法和统计模型结构。 -
数据挖掘技术及其应用杨杰 等编著《数据挖掘技术及其应用(精)》(作者杨杰、姚莉秀)系统地讲述了数据挖掘的基本概念和基本原理,并列举了在相应领域具有参考价值的算法及其改进和应用,是作者多年来从事教学和科研实践的成果。全书共9章,主要内容有:数据挖掘的基本概念和原理,数据预处理,各种分类、聚类和关联规则提取算法,以及在生物信息学、材料学中的实际应用案例。 《数据挖掘技术及其应用(精)》可用作计算机专业本?高年级学生或研究生的教材或参考书,也可供从事计算机信息处理、数据挖掘、工业优化等有关方面工作的科技人员参考。 -
知识发现史忠植 著知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据资源中发现知识宝藏,将为知识创新和知识经济的发展作出贡献。《知识发现》全面而又系统地介绍了知识发现的方法和技术,反映了当前知识发现研究的最新成果和进展。全书共分15章。第1章是绪论,概述知识发现的重要概念和发展过程。下面三章重点讨论分类问题,包括决策树、支持向量机和迁移学习。第5章阐述聚类分析。第6章是关联规则。第7章讨论粗糙集和粒度计算。第8章介绍神经网络,书中着重介绍几种实用的算法。第9章探讨贝叶斯网络。第10章讨论隐马尔可夫模型。第11章探讨图挖掘。第12章讨论进化计算和遗传算法。第13章探讨分布式知识发现,它使海量数据挖掘成为可能。最后两章以web知识发现、认知神经科学为例,介绍知识发现的应用。书中内容新颖,认真总结了作者的科研成果,取材国内外最新资料,反映了当前该领域的研究水平。论述力求概念清晰,表达准确,算法丰富,突出理论联系实际,富有启发性。《知识发现》可以用作高等院校有关专业的研究生和高年级本科生的知识发现、数据挖掘、机器学习等课程教材,也可供从事知识发现、数据挖掘、机器学习、智能信息处理、模式识别、智能控制研究和知识管理的科技人员阅读参考。 -
数据仓库与数据挖掘原理及应用郑岩 编著《数据仓库与数据挖掘原理及应用》从专业角度全面介绍了数据仓库和数据挖掘的理论、方法、技术及其应用,系统地阐述了数据仓库和数据挖掘的产生、发展和应用及其主要概念、原理和算法,并结合当前数据仓库和数据挖掘中一些新的应用实例进一步加以说明,力求学以致用。全书分为三篇。第一篇介绍数据仓库的起源和演变过程,阐述数据仓库的定义、体系结构、组成、元数据、数据粒度和数据模型以及ETL过程,论述数据仓库设计和实现的方法。结合具体应用详细阐述了如何构建数据仓库及其主要应用,包括OLAP和OLAM等。第二篇介绍数据挖掘的起源和发展趋势,以及数据挖掘与web挖掘的技术和方法,包括聚类、分类、预测和关联分析等,详细分析了数据挖掘在电信领域的具体应用,如客户细分、重入网识别和WAP日志挖掘等。第三篇讨论数据、信息和知识的关系,论述知识表示的主要方法和知识管理的核心技术,介绍当前研究热点——语义网和本体的核心技术和方法,分析了语义网和本体的主要应用。《数据仓库与数据挖掘原理及应用》可作为计算机专业研究生或高年级本科生教材,也可以作为计算机研究和开发人员以及相关专业人士的参考资料。 -
数据挖掘导论(美)陈封能,(美)斯坦巴赫,(美)库玛尔 著,范明 等译《数据挖掘导论(完整版)》全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。《数据挖掘导论(完整版)》涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。《数据挖掘导论(完整版)》适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为数据挖掘研究和应用开发人员的参考书。 -
海量数据挖掘技术研究刘君强 著随着信息技术特别是网络技术的飞速发展,人们收集、存贮、传输数据的能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是:对决策有价值的知识却非常匮乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。数据挖掘要在实际应用中发挥作用,高性能挖掘算法和数据挖掘软件平台是重要的技术基础。本书以数据挖掘最基本问题、频繁模式与关联规则挖掘为切入点,研究高时间效率、高空间可伸缩性的挖掘算法和分布,异质、海量数据的协同挖掘软件模型,并探讨了数据挖掘过程中的隐私保护问题。本书首先发现了基于树表示形式的虚拟投影方法,用于按深度优先挖掘密集型数据集;提出了稀疏型数据集表示形式及非过滤投影方法;进_步提出了基于伺机投影的思想,设计并实现了基于伺机投影的全新算法OpportuneProject,对比实验表明,该算法挖掘各种规模与特性数据库的效率与可伸缩性都是最佳的。由于其内在的计算复杂性,挖掘密集型数据的频繁模式完全集非常困难,解决办法是挖掘频繁模式的闭合集或最大集。本书提出了一种组织闭合模式集的复合型频繁模式树,支持搜索空间的高效剪裁,有效地平衡了树生成与树剪裁的代价,实现了闭合模式集挖掘算法CROP,其效率与可伸缩性大大优于CHARM等算法。在此基础上,本书提出了闭合性剪裁和一般性剪裁相结合,并能适时前窥的最大模式挖掘算法MOP,大大优于MaxMiner和MAFIA等算法。本书进一步提出了逆字典树剪裁、层次标记等新技术,以及根据信息熵自动生成与人机交互相结合来确定数值型与类别型属性概念层次的新方法,不仅支持逐层挖掘,而且能进行跨层挖掘,并实现了多支持率剪裁,将所提出的挖掘频繁模式完全集、闭合集的新算法推广到无冗余关联规则、多维多层多数据类型关联规则、多支持率分类规则的挖掘问题。本书在所取得的数据挖掘算法研究成果基础上,对数据挖掘软件模型作了深入研究。首先提出了数据挖掘作业描述语言MDL和挖掘任务模型脚本语言,设计并实现了一个集成数据仓库管理功能、挖掘引擎具有一定智能、体系结构可扩展的数据挖掘工具。本书在研究分布式问题求解技术和分析移动型智能代理技术的基础上,提出了从网络海量数据中发现有用知识的协同挖掘模型。首先定义了黑板和知识源的描述语言以及知识交换格式,设计和实现了支持互联网上分布式问题求解的黑板系统,提出了分布式网络海量数据挖掘系统DistributedMiner。接着在分析移动式智能代理技术的基础上,设计了一种移动式智能代理服务器,通过重构基础结构,提出了移动式网络海量数据挖掘系统模型MobileMiner。最后,本书研究了挖掘事务型数据过程中的隐私保护问题。由于事务型数据的极度稀疏性,任何单一技术难以有效发挥作用,或是导致过高的信息损失,或是处理结果难以解释,或是技术自身性能有缺陷。本书提出了集成概化技术与消隐技术来降低信息损失。然而,从技术上讲,集成并非易事。本书提出了一种新颖的方法来解决效率与可伸缩性的问题。采用此方法处理过的数据能够应用标准的数据挖掘工具进行分析。 -
基于统计视角的数据挖掘研究徐雪琪 著《基于统计视角的数据挖掘研究》从统计学视角研究数据挖掘,以期从统计学角度对数据挖掘理论的研究有所突破和创新,同时对统计学理论在数据挖掘方向的发展做出探索。笔者认为数据挖掘的出现,正是统计学适应这一变化的新的发展方向,数据挖掘并不是为了替代传统的统计分析技术,而是统计分析方法的延伸和扩展。 -
RAID数据恢复技术揭秘汪中夏,张京生,刘伟 编著《RAID数据恢复技术揭秘(附光盘)》在系统地介绍各种类型RAID的结构和工作原理的基础上,深入浅出地讲解了RAID数据恢复的方法和技巧,同时,针对市场上主流的Windows、Linux、UNIX和Apple等多种文件系统,提供了大量RAID数据恢复的实际案例供读者学习。采用自然形象的方式描述RAID系统的抽象概念;同一个恢复案例,注重对不同的恢复方法进行比较分析。《RAID数据恢复技术揭秘(附光盘)》概念清楚,逻辑性强,图文并茂,内容新颖。《RAID数据恢复技术揭秘(附光盘)》适合数据恢复、信息安全等领域的从业人员以及对RAID数据恢复技术感兴趣的人员阅读,也可作为大专院校计算机相关专业学生的教材或参考书。 -
数据挖掘导论(美)谭,斯坦巴克,库马尔 著《数据挖掘导论(英文版)》全面介绍了数据挖掘的理论和方法,着重介绍如何用数据挖掘知识解决各种实际问题,涉及学科领域众多,适用面广。书中涵盖5个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。包含大量的图表、综合示例和丰富的习题。·不需要数据库背景。只需要很少的统计学或数学背景知识。·网上配套教辅资源丰富,包括PPT、习题解答、数据集等。
