数据库挖掘/数据仓库
-
Web数据挖掘(美)刘兵(Liu,B.) 著,俞勇 等译《Web数据挖掘》旨在讲述这些任务以及它们的核心挖掘算法;尽可能涵盖每个话题的广泛内容,给出足够多的细节,以便读者无须借助额外的阅读,即可获得相对完整的关于算法和技术的知识。其中结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等4章是《Web数据挖掘》的特色,这些内容在已有书籍中没有提及,但它们在Web数据挖掘中却占有非常重要的地位。当然,传统的Web挖掘主题,如搜索、页面爬取和资源探索以及链接分析在书中也作了详细描述。《Web数据挖掘》尽管题为“Web数据挖掘”,却依然涵盖了数据挖掘和信息检索的核心主题;因为Web挖掘大量使用了它们的算法和技术。数据挖掘部分主要由关联规则和序列模式、监督学习(分类)、无监督学习(聚类)这三大最重要的数据挖掘任务,以及半监督学习这个相对深入的主题组成。而信息检索对于Web挖掘而言最重要的核心主题都有所阐述。
-
高维聚类知识发现关键技术研究及应用陈建斌 著知识发现是从数据集中抽取和精化新的模式的过程,基于数据库的知识发现(Knowledge Discovery in Database,KDD))是知识发现研究的主体和热点,而聚类知识发现又是知识发现的重要方面。如何有效处理巨量、高维的数据,是当前聚类分析的关键技术。本书围绕高维数据的聚类问题展开研究,在讨论高维数据相似I生尤其是高维二元数据相似性定义的基础上,提出了基于粗图模型的硬聚类和软聚类算法、高维二元数据的映射聚类算法、基于蚂蚁行为的聚类算法等,并进一步提出基于映射聚类的离群点检测方法;还特别讨论了高维聚类结果的表示方法问题,提出了应用粗糙集高效表达聚类结果的方法;最后探讨了聚类知识发现数据建模的基本步骤,给出了聚类知识发现的典型应用案例。本书学术性、知识性并重,可供从事数据仓库与数据挖掘教学、研究的师生、学者阅读,也可以为从事数据挖掘、知识发现系统等软件工程技术人员提供参考。
-
数据挖掘技术谭建豪 等编著《数据挖掘技术》较为系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的最新进展,并以较大篇幅叙述了数据挖掘在复杂工业系统中的应用情况。《数据挖掘技术》深入而系统地阐述了数据挖掘的研究历史和现状、数据挖掘与数理统计的关系、数据挖掘技术(包括语义网络、智能体、分类、预测、复杂类型数据等基础概念和技术)、数据库系统及专家系统中的数据挖掘方式、数据挖掘的应用及一些具有挑战性的研究课题,对每类问题均提供了代表性算法和具体应用法则。全书共分7章,主要内容包括数据挖掘综述、从数理统计到数据挖掘、语义网络挖掘及其应用、智能体挖掘及其应用、分类挖掘及其应用、预测挖掘及其应用和复杂类型数据挖掘及其应用。《数据挖掘技术》可作为高等院校自动化、电子信息、测控技术与仪表、电气工程、系统工程、机电工程等专业的本科生和研究生教材,也可作为相关专业工程技术人员的自学参考书。
-
规则挖掘技术张德干,王晓晔 著规则挖掘技术是指从数据库中抽取隐含的、潜在的、先前未知的、有用的知识和规则的一门交叉学科技术。它受多个学科的影响,同时它又对多个学科的发展、应用产生积极而深远的影响,具有十分重要的促进作用。《信息与通信工程研究生系列教材:规则挖掘技术》涉及的内容有规则挖掘技术概论、具有冗余约简能力的规则挖掘机制、分明关系约束的格上规则挖掘方法、基于包含度的决策树中规则挖掘方法、基于时间序列的规则挖掘方法、规则挖掘过程中的分类技术、应用案例等内容。《信息与通信工程研究生系列教材:规则挖掘技术》介绍的规则挖掘技术新颖、涵盖面广、信息量大、实用性强。《信息与通信工程研究生系列教材:规则挖掘技术》图文并茂,十分方便本科生、研究生、教师学习和参考,也非常方便从事数据挖掘以及相关领域的科研和工程开发技术人员阅读、参考。
-
分布式连锁商业数据挖掘模型肖亮 著在知识成为企业核心竞争力的今天,如何从海量动态商业数据中提炼出有价值的商业知识,指导企业经营管理和科学决策,已经成为连锁商业企业持续健康发展的关键所在。《分布式连锁商业数据挖掘模型》针对连锁商业数据的特性,采用国内外数据挖掘理论的最新热点——分布式商业数据挖掘技术,以连锁商业企业为主要研究和应用对象,全面、系统、深入的探讨了分布式商业数据挖掘理论和技术应用。通过实证研究,验证了这一理论的科学性和实践性。
-
数据挖掘吕晓玲,谢邦昌 编著随着信息技术的飞速发展,数据的产生和存储达到了空前繁荣的阶段。如何从海量的数据中提取潜在的有用信息,给传统的数据处理技术提出了严峻的考验,数据挖掘方法应运而生。数据挖掘是一个多学科的交叉研究领域,不仅大学里的学术人员在研究它,商业公司的专家和技术人员也在密切地关注它和使用它;它不仅涉及人工智能领域以及统计学的应用,而且涉及数据库的管理和使用。从技术上来讲,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又潜在有用的信息和知识的过程。从商业应用来讲,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。本书第1章对数据挖掘进行了概述,包括数据挖掘的定义、重要性、功能、步骤和常用方法等。第2章和第3章介绍了两种数据挖掘中常用的指导的学习算法、关联规则和聚类分析,它们处理的数据的特点是没有独立的需要预测或分类的变量,而只是试图从数据中发现一些固有的模式。关联规则就是要发现两个或多个事物之间的联系;聚类分析就是要把数据中具有相似性质的放在一类,而不同类之间尽量做到有较大的不同。第4章和第5章介绍了两种数据挖掘中常用的指导的学习算法、决策树和神经网络。它们处理的数据含有独立的需要预测或分类的变量,它们的目的就是寻找一些自变量的函数或算法对数据进行准确的预测或分类。决策树方法在对数据处理的过程中,将数据按照树状结构分成若干分枝形成决策规则;神经网络在一定程度上模仿了人脑神经系统处理信息,存储以及检索的功能,它是一个非线性的映射系统。第6章和第7章介绍了两种数据挖掘中常用的传统统计的方法,回归分析和时间序列。回归分析是寻找自变量和因变量之间关系的预测模型,包括线性回归和Logistic回归;时间序列分析,顾名思义,是处理以时间为序的观测数据的方法。本书的一个特点是不仅对上述方法作了理论的阐述,还结合案例分析讲述了如何应用STATISTICA软件实现上述方法对数据的分析,是一本理论和实践相结合的理论性和应用性都很强的书。
-
基于知识的聚类(加)派垂驰(Pedrycz,W) 著;于福生 译《基于知识的聚类:从数据到信息粒》首先对模糊聚类和粒计算这一领域进行介绍和讨论。然后,作者深入研究了基于逻辑的神经元和神经网络。《基于知识的聚类:从数据到信息粒》的核心部分包括9章,在其中呈现和分析了众多不同的基于知识的聚类的方法。基于知识的聚类展示的是如何设计一个导航平台,以使信息探寻者能理解和较好的应用种类繁多的数据集。比模糊聚类走得更远,作者展示了基于知识的聚类这一有前景的新范例是如何揭示更有意义的数据结构,并使社会更好地处理日益增长的数据和信息流。通过这《基于知识的聚类:从数据到信息粒》,读着能理解基于知识聚类的基础和与其相关联的算法,学会将他们自己的知识应用到系统建模和设计中去。《基于知识的聚类:从数据到信息粒》的第三部分致力于模型的研究,首先讨论超盒结构,然后讨论粒映射和语言模型。《基于知识的聚类:从数据到信息粒》提供了理解和掌握这一令人振奋的新领域所需要的所有工具和指导:◆说明核心概念的众多实例◆为读者提供传递经验的可重复实验◆为复杂算法和建模奠定基础的先决条件的全面涵盖◆每章后面强调理解内容所必须的关急键点的总结◆通向专题探究的进一步途径的参考文献和泛的参考书目《基于知识的聚类:从数据到信息粒》是对聚类、模糊聚类、无监督学习、神经网络、模糊集、模式识别和系统建模感兴趣的研究人员、专家及学生的必读之物。有了作者对掌握必备知识的强调,以及精心构建的实例和实验,读者将成功地使自己成为基于知识聚类的专家。WITOLDPEDRYCZ,博士,加拿大阿尔伯塔大学教授,加拿大首席专家。他还任职于波兰科学院系统研究所(波兰、华沙)。Pedrycz博士是IEEEFellow,已经编写了9部专著,编辑了9卷书籍,在计算智能、粒计算、模式识别、定量软件工程和数据挖掘方面发表了很多论文。
-
Web数据挖掘(印)查凯莱巴蒂 著本书是信息检索领域的名著,深入讲解了从大量非结构化Web数据中提取和产生知识的技术。书中首先论述了Web的基础(包括Web信息采集机制、Web标引机制以及基于关键字或基于相似性搜索机制),然后系统地描述了Web挖掘的基础知识,着重介绍基于超文本的机器学习和数据挖掘方法,如聚类、协同过滤、监督学习、半监督学习,最后讲述了这些基本原理在Web挖掘中的应用。本书为读者提供了坚实的技术背景和最新的知识。本书是从事数据挖掘学术研究和开发的专业人员理想的参考书,同时也适合作为高等院校计算机及相关专业研究生的教材。
-
数据挖掘基础教程(印度)西蒙(Soman.K.P) 等著;范明,牛常勇 译本书全面介绍数据挖掘的原理、方法和算法。主要内容包括数据挖掘的基本概念、数据挖掘算法的数据类型、输入和输出、决策树、数据挖掘的预处理和后处理、关联规则挖掘、分类和回归算法、支持向量机、聚类分析及多维数据可视化。本书讲解深入浅出,并辅以大量实例,随书光盘提供了大量数据集以及两种广泛使用的数据挖掘软件——weka和ExcelMiner,便于读者理解数据挖掘知识。本书适合作为高等院校计算机及相关专业数据挖掘课程的教材,也可供广大技术人员参考。
-
数据仓库与数据挖掘廖开际 主编《数据仓库与数据挖掘》比较系统地介绍数据仓库与数据挖掘的理论体系和应用。《数据仓库与数据挖掘》总的指导思想是在掌握基本知识和基本理论的基础上,强调实际应用能力的培养。全书力求深入浅出,通过通俗的语言及案例分析,介绍数据仓库及数据挖掘的基本概念及相关理论与方法。从数据仓库的定义、结构、设计、构建方法及联机分析处理应用等方面对数据仓库进行较为详细的介绍;从数据挖掘的定义、数据预处理、数据挖掘中的常用算法等方面对数据挖掘的基本知识和算法等理论进行介绍。《数据仓库与数据挖掘》强调数据仓库和数据挖掘工具的应用,重点介绍SQL Server 2005数据仓库和数据挖掘工具的应用。附录A详细介绍一个简易的数据挖掘工具——Weka,该工具可作为读者学习数据挖掘时的实验工具。《数据仓库与数据挖掘》可作为普通高等学校电子商务、信息管理、计算机应用及其他相关专业的本科教材,也可作为经贸、管理类专业的研究生教材,以及各类管理人员的培训与自学用书。