数据库挖掘/数据仓库
-
海量数据挖掘技术研究刘君强 著随着信息技术特别是网络技术的飞速发展,人们收集、存贮、传输数据的能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是:对决策有价值的知识却非常匮乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。数据挖掘要在实际应用中发挥作用,高性能挖掘算法和数据挖掘软件平台是重要的技术基础。本书以数据挖掘最基本问题、频繁模式与关联规则挖掘为切入点,研究高时间效率、高空间可伸缩性的挖掘算法和分布,异质、海量数据的协同挖掘软件模型,并探讨了数据挖掘过程中的隐私保护问题。本书首先发现了基于树表示形式的虚拟投影方法,用于按深度优先挖掘密集型数据集;提出了稀疏型数据集表示形式及非过滤投影方法;进_步提出了基于伺机投影的思想,设计并实现了基于伺机投影的全新算法OpportuneProject,对比实验表明,该算法挖掘各种规模与特性数据库的效率与可伸缩性都是最佳的。由于其内在的计算复杂性,挖掘密集型数据的频繁模式完全集非常困难,解决办法是挖掘频繁模式的闭合集或最大集。本书提出了一种组织闭合模式集的复合型频繁模式树,支持搜索空间的高效剪裁,有效地平衡了树生成与树剪裁的代价,实现了闭合模式集挖掘算法CROP,其效率与可伸缩性大大优于CHARM等算法。在此基础上,本书提出了闭合性剪裁和一般性剪裁相结合,并能适时前窥的最大模式挖掘算法MOP,大大优于MaxMiner和MAFIA等算法。本书进一步提出了逆字典树剪裁、层次标记等新技术,以及根据信息熵自动生成与人机交互相结合来确定数值型与类别型属性概念层次的新方法,不仅支持逐层挖掘,而且能进行跨层挖掘,并实现了多支持率剪裁,将所提出的挖掘频繁模式完全集、闭合集的新算法推广到无冗余关联规则、多维多层多数据类型关联规则、多支持率分类规则的挖掘问题。本书在所取得的数据挖掘算法研究成果基础上,对数据挖掘软件模型作了深入研究。首先提出了数据挖掘作业描述语言MDL和挖掘任务模型脚本语言,设计并实现了一个集成数据仓库管理功能、挖掘引擎具有一定智能、体系结构可扩展的数据挖掘工具。本书在研究分布式问题求解技术和分析移动型智能代理技术的基础上,提出了从网络海量数据中发现有用知识的协同挖掘模型。首先定义了黑板和知识源的描述语言以及知识交换格式,设计和实现了支持互联网上分布式问题求解的黑板系统,提出了分布式网络海量数据挖掘系统DistributedMiner。接着在分析移动式智能代理技术的基础上,设计了一种移动式智能代理服务器,通过重构基础结构,提出了移动式网络海量数据挖掘系统模型MobileMiner。最后,本书研究了挖掘事务型数据过程中的隐私保护问题。由于事务型数据的极度稀疏性,任何单一技术难以有效发挥作用,或是导致过高的信息损失,或是处理结果难以解释,或是技术自身性能有缺陷。本书提出了集成概化技术与消隐技术来降低信息损失。然而,从技术上讲,集成并非易事。本书提出了一种新颖的方法来解决效率与可伸缩性的问题。采用此方法处理过的数据能够应用标准的数据挖掘工具进行分析。
-
数据仓库与数据挖掘原理及应用郑岩 编著《数据仓库与数据挖掘原理及应用》从专业角度全面介绍了数据仓库和数据挖掘的理论、方法、技术及其应用,系统地阐述了数据仓库和数据挖掘的产生、发展和应用及其主要概念、原理和算法,并结合当前数据仓库和数据挖掘中一些新的应用实例进一步加以说明,力求学以致用。全书分为三篇。第一篇介绍数据仓库的起源和演变过程,阐述数据仓库的定义、体系结构、组成、元数据、数据粒度和数据模型以及ETL过程,论述数据仓库设计和实现的方法。结合具体应用详细阐述了如何构建数据仓库及其主要应用,包括OLAP和OLAM等。第二篇介绍数据挖掘的起源和发展趋势,以及数据挖掘与web挖掘的技术和方法,包括聚类、分类、预测和关联分析等,详细分析了数据挖掘在电信领域的具体应用,如客户细分、重入网识别和WAP日志挖掘等。第三篇讨论数据、信息和知识的关系,论述知识表示的主要方法和知识管理的核心技术,介绍当前研究热点——语义网和本体的核心技术和方法,分析了语义网和本体的主要应用。《数据仓库与数据挖掘原理及应用》可作为计算机专业研究生或高年级本科生教材,也可以作为计算机研究和开发人员以及相关专业人士的参考资料。
-
数据挖掘导论(美)陈封能,(美)斯坦巴赫,(美)库玛尔 著,范明 等译《数据挖掘导论(完整版)》全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。《数据挖掘导论(完整版)》涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。《数据挖掘导论(完整版)》适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为数据挖掘研究和应用开发人员的参考书。
-
RAID数据恢复技术揭秘汪中夏,张京生,刘伟 编著《RAID数据恢复技术揭秘(附光盘)》在系统地介绍各种类型RAID的结构和工作原理的基础上,深入浅出地讲解了RAID数据恢复的方法和技巧,同时,针对市场上主流的Windows、Linux、UNIX和Apple等多种文件系统,提供了大量RAID数据恢复的实际案例供读者学习。采用自然形象的方式描述RAID系统的抽象概念;同一个恢复案例,注重对不同的恢复方法进行比较分析。《RAID数据恢复技术揭秘(附光盘)》概念清楚,逻辑性强,图文并茂,内容新颖。《RAID数据恢复技术揭秘(附光盘)》适合数据恢复、信息安全等领域的从业人员以及对RAID数据恢复技术感兴趣的人员阅读,也可作为大专院校计算机相关专业学生的教材或参考书。
-
数据挖掘导论(美)谭,斯坦巴克,库马尔 著《数据挖掘导论(英文版)》全面介绍了数据挖掘的理论和方法,着重介绍如何用数据挖掘知识解决各种实际问题,涉及学科领域众多,适用面广。书中涵盖5个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。包含大量的图表、综合示例和丰富的习题。·不需要数据库背景。只需要很少的统计学或数学背景知识。·网上配套教辅资源丰富,包括PPT、习题解答、数据集等。
-
数据备份与恢复何欢,何倩 著本书是国家级精品课程“数据备份与恢复”的配套教材,以数据恢复工程师的岗位需求为依托,以实际工作任务为导向,从硬盘结构与文件系统,数据备份,windows操作系统备份与恢复,windows文档修复,硬盘数据软件恢复,数据库备份与恢复,硬盘故障修复,u盘数据恢复,磁盘阵列数据修复等方面深入浅出地介绍了数据备份与恢复的基本知识和操作技能,着重强调数据恢复的技能训练。本书既可作为高职高专院校数据备份与恢复课程的教材,也可作为广大数据恢复爱好者和计算机管理员、系统安全人员的参考技术资料。
-
Clementine数据挖掘方法及应用薛薇 等编著《Clementine数据挖掘方法及应用》以数据挖掘的实践过程为主线,通过生动的应用案例,从数据挖掘实施角度,系统介绍了经典的数据挖掘方法和利用Clementine实现数据挖掘的全部过程,讲解方法从易到难,说明问题从浅至深。《Clementine数据挖掘方法及应用》力求以最通俗的方式阐述数据挖掘方法的核心思想与基本原理,同时配合Clementine软件操作的说明,希望读者能够直观了解方法本质,尽快掌握Clementine软件使用,并应用到数据挖掘实践中。为方便读者学习,书中所有数据和案例均与所附光盘内容一致。《Clementine数据挖掘方法及应用》适合于从事数据分析各应用领域的读者,尤其适合于商业管理、财政经济、金融保险、社会研究、人文教育等行业的相关人员。同时,也能够作为高等院校计算机类、财经类、管理类专业本科生和研究生的数据挖掘教材。数据挖掘是当前数据分析领域中最活跃最前沿的地带。Clementine充分利用计算机系统的运算处理能力和图形展现能力,将数据挖掘方法、应用与工具有机地融为一体,成为内容最为全面,功能最为强大的数据挖掘软件产品,是解决数据挖掘问题的最理想工具。
-
数据挖掘原理与应用(美)迈克伦南,(美)唐朝晖,(美)克里沃茨 著,董艳,程文俊 译SQL Server数据挖掘是业界使用最广泛的数据挖掘服务器。企业用户(甚至学术专家和科学家)都采用SQL Server数据挖掘技术,因为这种技术的可伸缩性很强,容易获得,功能广泛,并且易于使用。SQL Server的2008版本在数据挖掘方面有了令人兴奋的新改进,本书是SQL Server数据挖掘方面的经典之作,介绍了如何掌握最新功能,是部署和使用SQL Server数据挖掘技术的实用指南。本书的作者团队首先介绍了使用SQL Server 2008数据挖掘所需的工具、技术和概念,然后全面讨论了SQL Server 2008数据挖掘算法的细节,以及如何把SQL Server数据挖掘技术与SQL Server Business Intelligence(BI)套件的其他部分集成起来,扩展SQL Server数据挖掘技术,以满足自己的需要。本书中详尽而实用的示例清晰地解释了如何利用SQL Server 2008构建成功的数据挖掘解决方案。
-
动态数据挖掘倪志伟 等著《动态数据挖掘》是关于动态数据挖掘相关技术及其应用的著作,涉及数据流挖掘、分形数据挖掘、联机分析挖掘、经验模态分解和联系发现技术等。《动态数据挖掘》内容新颖,融入了近年来在学术界和工程界普遍关注的诸多热门课题,是作者及其课题组几年来完成国家级科研项目的成果结晶。动态数据挖掘是针对动态数据库和实时数据库进行知识提取的数据挖掘技术。随着信息技术的进一步发展,对知识新颖性的需求越来越强,采用传统的静态数据挖掘技术来分析不断产生的信息无法满足现实应用的要求,对实际应用数据源在其运行的同时进行动态数据挖掘得到相关知识显得日益重要。《动态数据挖掘》可作为管理科学与工程、计算机应用技术等学科高年级的本科生和研究生用书,也可供相关研究人员参考。
-
LabVIEW2009中文版虚拟仪器从入门到精通李瑞 等编著本书通过理论与实例结合的方式,深入浅出地介绍了LabVIEW 2009的使用方法和使用技巧。全书共分12章,包括LabVIEW 2009中文版的基本操作界面介绍,创建和编辑VI的方法,程序控制结构框图,变量与数据,信号及其分析,数据采集,VI的优化方法,LabVIEW在通信以及网络中的应用等知识。每个章节中都配有必要的实例,目的在于让读者结合实例更加快捷地掌握LabVIEW的编程方法。本书主要面向LabVIEW的初、中级用户可作为大、中专院校相关专业的教学和参考用书,也可供有关工程技术人员和软件工程师参考。