数据库挖掘/数据仓库
-
数据仓库与数据挖掘陈志泊 主编,韩慧 等编著《数据仓库与数据挖掘》主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。《数据仓库与数据挖掘》既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,《数据仓库与数据挖掘》都使用Microsoft SQL Server 2005进行了操作实现。《数据仓库与数据挖掘》通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。《数据仓库与数据挖掘》每章均配有习题,习题形式为选择题、简答题和操作题,可以帮助读者进一步巩固和掌握所学知识。此外,《数据仓库与数据挖掘》提供多媒体教学课件和习题参考答案,读者可到清华大学出版社网站(http://www.tup.com.cn/)下载。《数据仓库与数据挖掘》可以作为高等学校计算机及相关专业本科、研究生的数据仓库和数据挖掘教材,也可供相关领域的广大科技工作人员和高校师生参考。 -
数据仓库结构设计与实施池太崴 编著共分5章,涉及数据仓库的基本概念、定义及主要特点;根据数据仓库的基础技术和结构概念,采用从元数据、多维数据结构、联机分析处理、数据挖掘、数据仓库的基础部件到联机和成品分析报告一条龙的方法,描述了数据仓库设计与开发生命周期的各个阶段以及相应的技术结构框架;另外,还提供了大量的应用实例,如支票信用认可网络系统、某飞机制造公司单源生产数据、汽车销售管理网络系统等多个工程开发的成功案例;同时,《数据仓库结构设计与实施:建造信息系统的金字塔》还介绍了数据仓库开发过程和策略,主要有跳跃(蛙跳)式发展、数据仓库系统多层次的结构平台——内核与外壳、数据仓库应用开发的要点与特征、数据仓库设计、质量保障、任务、资源、团队、技能等基本内容;最后,通过一系列程序实例,讲解了数据仓库设计与应用开发的建立过程,以及SQL程序在Oracle 9i和SQL Server 分析服务器平台上的实施情况,包括概念设计、物理设计、ETL、总合管理、联机分析、SQL分析和报表构架等详细技术说明。《数据仓库结构设计与实施:建造信息系统的金字塔》以成功实践为基础,理论与技术实践密切结合,结构紧凑,内容新颖,图文并茂,论述精辟,可作为高等院校信息技术和管理专业、数据库专业教学与研究的教材;同时也适合从事信息系统研究与工程应用开发的广大科技人员作为学习与指导的参考读物。 -
基于协同网络信息的多指标决策方法樊治平,冯博 著《基于协同网络信息的多指标决策方法》将介绍作者近年来有关基于协同网络信息的多指标决策方法的主要研究成果。基于协同网络信息的决策问题广泛存在于现实生活中,如合作研发联盟的伙伴选择、R&D团队成员选择、交叉功能团队成员选择、知识创新团队的伙伴选择、优秀创新研究群体选择、虚拟团队相互信任评价、NPD团队协作满意评价等问题以及考虑技术兼容性的技术组合方案选择、考虑部件兼容性的产品配置、基于服务要素的服务设计以及基于组合效用的产品组合方案选择等问题。因而,基于协同网络信息的决策方法研究,不仅具有重要的学术价值,而且具有广阔的应用前景。《基于协同网络信息的多指标决策方法》可作为决策科学、管理科学和系统工程等领域的研究人员和管理人员的参考书,也可作为高等院校相关专业研究生的参考书。 -
Web数据挖掘(美)刘兵(Liu,B.) 著,俞勇 等译《Web数据挖掘》旨在讲述这些任务以及它们的核心挖掘算法;尽可能涵盖每个话题的广泛内容,给出足够多的细节,以便读者无须借助额外的阅读,即可获得相对完整的关于算法和技术的知识。其中结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等4章是《Web数据挖掘》的特色,这些内容在已有书籍中没有提及,但它们在Web数据挖掘中却占有非常重要的地位。当然,传统的Web挖掘主题,如搜索、页面爬取和资源探索以及链接分析在书中也作了详细描述。《Web数据挖掘》尽管题为“Web数据挖掘”,却依然涵盖了数据挖掘和信息检索的核心主题;因为Web挖掘大量使用了它们的算法和技术。数据挖掘部分主要由关联规则和序列模式、监督学习(分类)、无监督学习(聚类)这三大最重要的数据挖掘任务,以及半监督学习这个相对深入的主题组成。而信息检索对于Web挖掘而言最重要的核心主题都有所阐述。 -
可视化数据(美)弗莱(Fry,B.) 著;张羽 译《可视化数据》是一本关于计算信息设计的书籍。从如何获取原始数据开始,到如何理解原始数据,《可视化数据》都给出了非常详尽的介绍。《可视化数据》使用由作者开发的开源编程环境Processing编程,它非常简单易用。对于熟悉使用Java的程序员来说,《可视化数据》后面的章节还介绍了如何将Processing和Java结合使用。《可视化数据》是写给那些拥有一个数据集合,好奇如何探索它,并且考虑如何交流这些数据的人们的。随着我们处理越来越多的信息,需要可视化数据的人们的数量增长的非常迅速。更重要的是,读者已经超越了某些可视化领域的专家。通过让更大范围的人们都接触到可视化思想,我们在接下来的几十年中应该可以看到一些真正让人惊叹的事情。 -
高维聚类知识发现关键技术研究及应用陈建斌 著知识发现是从数据集中抽取和精化新的模式的过程,基于数据库的知识发现(Knowledge Discovery in Database,KDD))是知识发现研究的主体和热点,而聚类知识发现又是知识发现的重要方面。如何有效处理巨量、高维的数据,是当前聚类分析的关键技术。本书围绕高维数据的聚类问题展开研究,在讨论高维数据相似I生尤其是高维二元数据相似性定义的基础上,提出了基于粗图模型的硬聚类和软聚类算法、高维二元数据的映射聚类算法、基于蚂蚁行为的聚类算法等,并进一步提出基于映射聚类的离群点检测方法;还特别讨论了高维聚类结果的表示方法问题,提出了应用粗糙集高效表达聚类结果的方法;最后探讨了聚类知识发现数据建模的基本步骤,给出了聚类知识发现的典型应用案例。本书学术性、知识性并重,可供从事数据仓库与数据挖掘教学、研究的师生、学者阅读,也可以为从事数据挖掘、知识发现系统等软件工程技术人员提供参考。 -
Web数据挖掘(印)查凯莱巴蒂 著本书是信息检索领域的名著,深入讲解了从大量非结构化Web数据中提取和产生知识的技术。书中首先论述了Web的基础(包括Web信息采集机制、Web标引机制以及基于关键字或基于相似性搜索机制),然后系统地描述了Web挖掘的基础知识,着重介绍基于超文本的机器学习和数据挖掘方法,如聚类、协同过滤、监督学习、半监督学习,最后讲述了这些基本原理在Web挖掘中的应用。本书为读者提供了坚实的技术背景和最新的知识。本书是从事数据挖掘学术研究和开发的专业人员理想的参考书,同时也适合作为高等院校计算机及相关专业研究生的教材。 -
数据挖掘吕晓玲,谢邦昌 编著随着信息技术的飞速发展,数据的产生和存储达到了空前繁荣的阶段。如何从海量的数据中提取潜在的有用信息,给传统的数据处理技术提出了严峻的考验,数据挖掘方法应运而生。数据挖掘是一个多学科的交叉研究领域,不仅大学里的学术人员在研究它,商业公司的专家和技术人员也在密切地关注它和使用它;它不仅涉及人工智能领域以及统计学的应用,而且涉及数据库的管理和使用。从技术上来讲,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又潜在有用的信息和知识的过程。从商业应用来讲,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。本书第1章对数据挖掘进行了概述,包括数据挖掘的定义、重要性、功能、步骤和常用方法等。第2章和第3章介绍了两种数据挖掘中常用的指导的学习算法、关联规则和聚类分析,它们处理的数据的特点是没有独立的需要预测或分类的变量,而只是试图从数据中发现一些固有的模式。关联规则就是要发现两个或多个事物之间的联系;聚类分析就是要把数据中具有相似性质的放在一类,而不同类之间尽量做到有较大的不同。第4章和第5章介绍了两种数据挖掘中常用的指导的学习算法、决策树和神经网络。它们处理的数据含有独立的需要预测或分类的变量,它们的目的就是寻找一些自变量的函数或算法对数据进行准确的预测或分类。决策树方法在对数据处理的过程中,将数据按照树状结构分成若干分枝形成决策规则;神经网络在一定程度上模仿了人脑神经系统处理信息,存储以及检索的功能,它是一个非线性的映射系统。第6章和第7章介绍了两种数据挖掘中常用的传统统计的方法,回归分析和时间序列。回归分析是寻找自变量和因变量之间关系的预测模型,包括线性回归和Logistic回归;时间序列分析,顾名思义,是处理以时间为序的观测数据的方法。本书的一个特点是不仅对上述方法作了理论的阐述,还结合案例分析讲述了如何应用STATISTICA软件实现上述方法对数据的分析,是一本理论和实践相结合的理论性和应用性都很强的书。 -
数据挖掘技术谭建豪 等编著《数据挖掘技术》较为系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的最新进展,并以较大篇幅叙述了数据挖掘在复杂工业系统中的应用情况。《数据挖掘技术》深入而系统地阐述了数据挖掘的研究历史和现状、数据挖掘与数理统计的关系、数据挖掘技术(包括语义网络、智能体、分类、预测、复杂类型数据等基础概念和技术)、数据库系统及专家系统中的数据挖掘方式、数据挖掘的应用及一些具有挑战性的研究课题,对每类问题均提供了代表性算法和具体应用法则。全书共分7章,主要内容包括数据挖掘综述、从数理统计到数据挖掘、语义网络挖掘及其应用、智能体挖掘及其应用、分类挖掘及其应用、预测挖掘及其应用和复杂类型数据挖掘及其应用。《数据挖掘技术》可作为高等院校自动化、电子信息、测控技术与仪表、电气工程、系统工程、机电工程等专业的本科生和研究生教材,也可作为相关专业工程技术人员的自学参考书。 -
数据挖掘基础教程(印度)西蒙(Soman.K.P) 等著;范明,牛常勇 译本书全面介绍数据挖掘的原理、方法和算法。主要内容包括数据挖掘的基本概念、数据挖掘算法的数据类型、输入和输出、决策树、数据挖掘的预处理和后处理、关联规则挖掘、分类和回归算法、支持向量机、聚类分析及多维数据可视化。本书讲解深入浅出,并辅以大量实例,随书光盘提供了大量数据集以及两种广泛使用的数据挖掘软件——weka和ExcelMiner,便于读者理解数据挖掘知识。本书适合作为高等院校计算机及相关专业数据挖掘课程的教材,也可供广大技术人员参考。
