数据库挖掘/数据仓库
-
Web数据挖掘(印)查凯莱巴蒂 著本书是信息检索领域的名著,深入讲解了从大量非结构化Web数据中提取和产生知识的技术。书中首先论述了Web的基础(包括Web信息采集机制、Web标引机制以及基于关键字或基于相似性搜索机制),然后系统地描述了Web挖掘的基础知识,着重介绍基于超文本的机器学习和数据挖掘方法,如聚类、协同过滤、监督学习、半监督学习,最后讲述了这些基本原理在Web挖掘中的应用。本书为读者提供了坚实的技术背景和最新的知识。本书是从事数据挖掘学术研究和开发的专业人员理想的参考书,同时也适合作为高等院校计算机及相关专业研究生的教材。
-
数据挖掘吕晓玲,谢邦昌 编著随着信息技术的飞速发展,数据的产生和存储达到了空前繁荣的阶段。如何从海量的数据中提取潜在的有用信息,给传统的数据处理技术提出了严峻的考验,数据挖掘方法应运而生。数据挖掘是一个多学科的交叉研究领域,不仅大学里的学术人员在研究它,商业公司的专家和技术人员也在密切地关注它和使用它;它不仅涉及人工智能领域以及统计学的应用,而且涉及数据库的管理和使用。从技术上来讲,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又潜在有用的信息和知识的过程。从商业应用来讲,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。本书第1章对数据挖掘进行了概述,包括数据挖掘的定义、重要性、功能、步骤和常用方法等。第2章和第3章介绍了两种数据挖掘中常用的指导的学习算法、关联规则和聚类分析,它们处理的数据的特点是没有独立的需要预测或分类的变量,而只是试图从数据中发现一些固有的模式。关联规则就是要发现两个或多个事物之间的联系;聚类分析就是要把数据中具有相似性质的放在一类,而不同类之间尽量做到有较大的不同。第4章和第5章介绍了两种数据挖掘中常用的指导的学习算法、决策树和神经网络。它们处理的数据含有独立的需要预测或分类的变量,它们的目的就是寻找一些自变量的函数或算法对数据进行准确的预测或分类。决策树方法在对数据处理的过程中,将数据按照树状结构分成若干分枝形成决策规则;神经网络在一定程度上模仿了人脑神经系统处理信息,存储以及检索的功能,它是一个非线性的映射系统。第6章和第7章介绍了两种数据挖掘中常用的传统统计的方法,回归分析和时间序列。回归分析是寻找自变量和因变量之间关系的预测模型,包括线性回归和Logistic回归;时间序列分析,顾名思义,是处理以时间为序的观测数据的方法。本书的一个特点是不仅对上述方法作了理论的阐述,还结合案例分析讲述了如何应用STATISTICA软件实现上述方法对数据的分析,是一本理论和实践相结合的理论性和应用性都很强的书。
-
数据挖掘技术谭建豪 等编著《数据挖掘技术》较为系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的最新进展,并以较大篇幅叙述了数据挖掘在复杂工业系统中的应用情况。《数据挖掘技术》深入而系统地阐述了数据挖掘的研究历史和现状、数据挖掘与数理统计的关系、数据挖掘技术(包括语义网络、智能体、分类、预测、复杂类型数据等基础概念和技术)、数据库系统及专家系统中的数据挖掘方式、数据挖掘的应用及一些具有挑战性的研究课题,对每类问题均提供了代表性算法和具体应用法则。全书共分7章,主要内容包括数据挖掘综述、从数理统计到数据挖掘、语义网络挖掘及其应用、智能体挖掘及其应用、分类挖掘及其应用、预测挖掘及其应用和复杂类型数据挖掘及其应用。《数据挖掘技术》可作为高等院校自动化、电子信息、测控技术与仪表、电气工程、系统工程、机电工程等专业的本科生和研究生教材,也可作为相关专业工程技术人员的自学参考书。
-
数据挖掘基础教程(印度)西蒙(Soman.K.P) 等著;范明,牛常勇 译本书全面介绍数据挖掘的原理、方法和算法。主要内容包括数据挖掘的基本概念、数据挖掘算法的数据类型、输入和输出、决策树、数据挖掘的预处理和后处理、关联规则挖掘、分类和回归算法、支持向量机、聚类分析及多维数据可视化。本书讲解深入浅出,并辅以大量实例,随书光盘提供了大量数据集以及两种广泛使用的数据挖掘软件——weka和ExcelMiner,便于读者理解数据挖掘知识。本书适合作为高等院校计算机及相关专业数据挖掘课程的教材,也可供广大技术人员参考。
-
规则挖掘技术张德干,王晓晔 著规则挖掘技术是指从数据库中抽取隐含的、潜在的、先前未知的、有用的知识和规则的一门交叉学科技术。它受多个学科的影响,同时它又对多个学科的发展、应用产生积极而深远的影响,具有十分重要的促进作用。《信息与通信工程研究生系列教材:规则挖掘技术》涉及的内容有规则挖掘技术概论、具有冗余约简能力的规则挖掘机制、分明关系约束的格上规则挖掘方法、基于包含度的决策树中规则挖掘方法、基于时间序列的规则挖掘方法、规则挖掘过程中的分类技术、应用案例等内容。《信息与通信工程研究生系列教材:规则挖掘技术》介绍的规则挖掘技术新颖、涵盖面广、信息量大、实用性强。《信息与通信工程研究生系列教材:规则挖掘技术》图文并茂,十分方便本科生、研究生、教师学习和参考,也非常方便从事数据挖掘以及相关领域的科研和工程开发技术人员阅读、参考。
-
分布式连锁商业数据挖掘模型肖亮 著在知识成为企业核心竞争力的今天,如何从海量动态商业数据中提炼出有价值的商业知识,指导企业经营管理和科学决策,已经成为连锁商业企业持续健康发展的关键所在。《分布式连锁商业数据挖掘模型》针对连锁商业数据的特性,采用国内外数据挖掘理论的最新热点——分布式商业数据挖掘技术,以连锁商业企业为主要研究和应用对象,全面、系统、深入的探讨了分布式商业数据挖掘理论和技术应用。通过实证研究,验证了这一理论的科学性和实践性。
-
基于知识的聚类(加)派垂驰(Pedrycz,W) 著;于福生 译《基于知识的聚类:从数据到信息粒》首先对模糊聚类和粒计算这一领域进行介绍和讨论。然后,作者深入研究了基于逻辑的神经元和神经网络。《基于知识的聚类:从数据到信息粒》的核心部分包括9章,在其中呈现和分析了众多不同的基于知识的聚类的方法。基于知识的聚类展示的是如何设计一个导航平台,以使信息探寻者能理解和较好的应用种类繁多的数据集。比模糊聚类走得更远,作者展示了基于知识的聚类这一有前景的新范例是如何揭示更有意义的数据结构,并使社会更好地处理日益增长的数据和信息流。通过这《基于知识的聚类:从数据到信息粒》,读着能理解基于知识聚类的基础和与其相关联的算法,学会将他们自己的知识应用到系统建模和设计中去。《基于知识的聚类:从数据到信息粒》的第三部分致力于模型的研究,首先讨论超盒结构,然后讨论粒映射和语言模型。《基于知识的聚类:从数据到信息粒》提供了理解和掌握这一令人振奋的新领域所需要的所有工具和指导:◆说明核心概念的众多实例◆为读者提供传递经验的可重复实验◆为复杂算法和建模奠定基础的先决条件的全面涵盖◆每章后面强调理解内容所必须的关急键点的总结◆通向专题探究的进一步途径的参考文献和泛的参考书目《基于知识的聚类:从数据到信息粒》是对聚类、模糊聚类、无监督学习、神经网络、模糊集、模式识别和系统建模感兴趣的研究人员、专家及学生的必读之物。有了作者对掌握必备知识的强调,以及精心构建的实例和实验,读者将成功地使自己成为基于知识聚类的专家。WITOLDPEDRYCZ,博士,加拿大阿尔伯塔大学教授,加拿大首席专家。他还任职于波兰科学院系统研究所(波兰、华沙)。Pedrycz博士是IEEEFellow,已经编写了9部专著,编辑了9卷书籍,在计算智能、粒计算、模式识别、定量软件工程和数据挖掘方面发表了很多论文。
-
数据仓库与数据挖掘廖开际 主编《数据仓库与数据挖掘》比较系统地介绍数据仓库与数据挖掘的理论体系和应用。《数据仓库与数据挖掘》总的指导思想是在掌握基本知识和基本理论的基础上,强调实际应用能力的培养。全书力求深入浅出,通过通俗的语言及案例分析,介绍数据仓库及数据挖掘的基本概念及相关理论与方法。从数据仓库的定义、结构、设计、构建方法及联机分析处理应用等方面对数据仓库进行较为详细的介绍;从数据挖掘的定义、数据预处理、数据挖掘中的常用算法等方面对数据挖掘的基本知识和算法等理论进行介绍。《数据仓库与数据挖掘》强调数据仓库和数据挖掘工具的应用,重点介绍SQL Server 2005数据仓库和数据挖掘工具的应用。附录A详细介绍一个简易的数据挖掘工具——Weka,该工具可作为读者学习数据挖掘时的实验工具。《数据仓库与数据挖掘》可作为普通高等学校电子商务、信息管理、计算机应用及其他相关专业的本科教材,也可作为经贸、管理类专业的研究生教材,以及各类管理人员的培训与自学用书。
-
数据挖掘朱明 编著数据挖掘技术,又称为数据库知识发现,是20世纪90年代在信息技术领域开始迅速发展起来的计算机技术。作者结合自己近20年从事人工智能、机器学习、数据挖掘等方面的科研工作积累与教学经验,编著此书。本书较全面系统地介绍了数据挖掘中常用和常见的数据挖掘方法,以及文本与视频数据挖掘方法。本书的主要内容包括:数据挖掘基本知识、数据挖掘预处理方法、决策树分类及其他分类方法、关联知识挖掘方法、各种聚类分析方法,以及文本挖掘所涉及表示、分类和聚类等方法,还包括视频挖掘所涉及的视频镜头检测、字幕提取、视频摘要和视频检索等主要分析方法。本书作为学习、掌握和应用数据挖掘方法和技术的综合指导书,是从事数据挖掘研究与应用人员,以及希望了解数据挖掘主要方法和技术的IT技术人员的良师益友;同时也是一本可用于大学高年级或研究生相关课程的教材和参考文献。
-
医学数据仓库与数据挖掘张承江 主编医学数据仓库是数据仓库技术面向医学领域数据的具体实现。与其他企业数据仓库相比,医学数据仓库的数据来源、数据类型和数据特征都有其特殊之处。建立医学数据仓库是医学数据分析处理的基础,是医学信息技术发展的必然,对于医学、医疗卫生、药物学和医学管理等领域的研究与应用都有巨大的推动作用。医学数据挖掘所面临的数据对象类型十分丰富,包括文本、图形、图像等;数据来源也非常广泛。临床医疗和医学研究已积累了大量的信息,如何有效地存储、检索、处理和分析医学数据,为医学决策提供支持,已为医学工作者和信息技术工作者强烈关注。该领域的分析与挖掘技术极富前景,也极具挑战性。本书力图从两个角度观察和分析医学数据处理与分析技术。一方面从信息技术的角度介绍数据仓库及数据分析与挖掘的基本原理、技术和发展前景;另一方面从医学科学的角度介绍医学信息与医学数据以及相关处理技术的特殊性和最新的研究成果。本书可作为医学院校的本科生和研究生教材。也适合于医学领域从事数据处理的专业技术人员阅读。