数据库挖掘/数据仓库
-
数据结构邓文化 主编《数据结构(第2版)》对常用的数据结构做了系统的介绍,力求概念清晰,注重实际应用。全书共分9章,依次介绍了数据结构的基本概念、线性表、栈和队列、串和数组、树结构和图结构,以及查找和排序等基本运算。全书以C语言作为算法描述语言,且每章后均列举了典型应有实例,并配有电子课件,供教师教学使用。《数据结构(第2版)》配套出版了《数据结构实验与实训教程》,便于教学实验、课程设计及复习应考。《数据结构(第2版)》主要面向高职高专院校计算机专业的学生,也可以作为大学非计算机专业的选修课教材和计算机应用技术人员的自学参考书。
-
数据挖掘原理与算法毛国君、段立娟、等本书是一本全面介绍数据挖掘和知识发现技术的专业书籍,它系统地阐述了数据挖掘和知识发现技术的产生、发展、应用以及相关概念、原理和算法,对数据挖掘中的主要技术分支,包括关联规则、分类、聚类、序列、空间以及web挖掘等进行了理沦剖析和算法描述。本书的许多内容是作者们在攻读博士学位期间的工作总结,一方面,对于相关概念和技术的阐述尽量先从理论分析人手,在此基础上进行技术归纳;另一方面,为了保证技术的系统性,所有的挖掘模型和算法描述都在统一的技术归纳框架下进行。同时,为了避免抽象算法描述给读者带来的理解困难,本书的所有典型算法都通过具体跟踪执行实例来进一步说明。本书共分8章,各章相对独立成篇,以利于读者选择性学习。在每章后面都设置专门一节来对本章内容和文献引用情况进行归纳,它不仅可以帮助读者对相关内容进行整理,而且也起到对本内容相关文献的注释性索引功能。第1章是绪论,系统地介绍了数据挖掘产生的商业和技术背景,从不同侧面剖析了数据挖掘的概念和应用价值;第2章给出了知识发现的过程分析和应用体系结构设计;第3章对关联规则挖掘的原理和算法进行全面阐述;第4章给出分类的主要理论和算法描述;第5章讨论聚类的常用技术和算法;第6章对时间序列分析技术和序列挖掘算法进行论述;第7章系统地介绍了Web挖掘的主要研究领域和相关技术及算法;第8章是对空间数据挖掘技术和算法的分析和讲述。本书可作为计算机专业研究生或高年级本科生教材,也可以作为从事计算机研究和开发人员的参考资料。作为教材,教师可以根据课时安排进行选择性教学。为了更好地让教师进行选择性教学,本书配有专门的教师用书,对内容的重点、难点和课时分配给出了对应的建议,对重要的和难度较大的习题进行了分析和解答。对于研究人员,本书是一本高参考价值的专业书籍。对于软件技术人员,可以把它当作提高用书或参考资料,一些算法可以通过改造用于实际的应用系统中。
-
数据挖掘与粗糙集方法张文宇,贾嵘 著数据挖掘是人工智能、机器学习、数据库技术等多学科相结合的产物。本书系统介绍了数据挖掘技术的基本原理、主要方法、挖掘模式、发展及应用,重点对基于粗糙集方法的数据挖掘过程进行了系统的阐述,全面地分析了静态与增量式的相容性与不相容性决策系统的数据挖掘主要算法、基于有序与无序决策系统的数据挖掘主要算法、粗糙集合的扩展模型。本书可作为系统工程、控制工程及计算机类专业研究生的学习工具,也可作为相关专业技术人员的参考书。
-
数据挖掘及其在客户关系管理中的应用张喆信息社会中数据的爆炸性增长,“丰富的数据与贫乏的知识”问题的日渐突出,产生了对强有力的数据分析工具的需求。决策者迫切需要将海量数据转换成有价值的信息和知识。数据挖掘为这一需求提供了强有力的技术支持。客户关系管理(CRM)是现代电子商务活动的核心部分,对CRM 的重视是现代市场营销理念和商业运作方式转变的结果。CRM是数据挖掘的重要应用领域。数据挖掘及其在CRM中的应用研究已经成为学术界和企业界共同关注的领域。本著作在对数据挖掘、CRM以及数据挖掘在CRM中的应用的研究现状进行文献综述的基础上,提出了数据挖掘技术及其在CRM中的应用研究的相关主题,主要完成了以下三个方面的研究工作:第一,数据挖掘中概念数据集成的模型研究。该研究描述了面向OLAP 集成XML数据和关系数据的概念数据集成结构体系框架,并提出了面向OLAP 的一个多维数据概念模型UML星系模式。最后通过一个B2B的电子商务中的 2-根UML星系模式的构建实例来说明了n-根UML星系模式的构造过程 模型的建立为电子商务中多数据源基础上多主题OLAP分析、描述和建模提供了一种方法。第二,数据挖掘中的组合分类方法研究。该研究从数据挖掘优化的技术角度出发,依据并行组合分类方法的思想,采用基于遗传算法的组合算法,提出一种基于遗传算法的多重决策树并行组合分类方法以提高分类精度,并在保持分类结果良好可解释性的基础上优化分类规则。第三,组合分类方法在CRM中的应用研究。该研究针对CRM中客户风险分析和客户获取策略问题,以客户风险分析中的客户信用等级评定问题和客户获取策略中的客户反应行为模式问题为研究对象,采用本文提出的基于遗传算法的多重决策树并行组合分类方法进行研究分析。通过这种组合分类方法的运用,在客户信用等级评定问题中进一步提高了客户信用的定位水平,减少了企业运营的风险;在客户反应行为模式的分类分析中,通过分类定位模型辅助决策人 员进行客户细分,定位他们的最佳客户和潜在客户。同时通过进一步的仿真分析得出,基于遗传算法的多重决策树组合分类方法比单个决策树具有更高的分类精度,并在保持分类结果良好的可解释性的基础上优化了分类规则。随着数据挖掘技术的进一步发展,这一研究领域研究价值越来越大。同时,随着数据挖掘技术在电子商务时代CRM中的应用进一步深入,CRM必然具有更广泛的市场价值和更广阔的应用前景。因此,本书关于数据挖掘及其在CRM中的应用的研究主题具有重要的学术价值和实践意义。
-
数据挖掘与最优化技术及其应用袁玉波、杨传胜、等《数据挖掘与最优化技术及其应用》介绍几类数据挖掘问题优化模型以及用于求解数据挖掘优化模型的优化算法,其中包括算法设计和数值实验。书中详细介绍了数据分类问题、数据聚类问题、回归问题、等基数的双目录分割问题、数据相关性问题的最优化数学模型以及关联规则挖掘算法和因果规则的近似表示理论。本书反映了数据挖掘的数学理论基础的最新研究成果。本书可作为数据挖掘理论和算法及相关专业的研究生教材,也可作为相关专业科技工作者的参考书。
-
数据挖掘概念与技术(加)韩家炜,堪博 著,范明,孟小峰 译本书第2版在十分丰富和全面的第1版基础上进行了更新和改进,并增添了新的重要课题,例如挖掘流数据、挖掘社会网络和挖掘空间、多媒体和其他复杂数据。本书将是一本适用于数据挖掘和知识发现课程的优秀教材。. ——Gregory Piatetsky-Shapiro, KDnuggets的总裁科学的飞速发展使产生和收集数据的能力快速增长。大多数商业、科学和政府事务的日益计算机化,数码相机、发布工具和条码的广泛应用都产生着大量的数据。在数据收集方面,扫描的文本和图像平台、卫星遥感系统和互联网已经使我们生活在海量的数据之中。这种爆炸性的数据增长促使我们比以往更迫切地需要新技术和自动化工具,以帮助我们将这些数据转换为有用的信息和知识。.. 本书第1版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的技术研究进展,重点关注其可行性、有用性、有效性和可伸缩性问题。第1版出版之后,数据挖掘领域的研究又取得了很大的进展,开发出了新的数据挖掘方法、系统和应用。第2版在这方面进行了充实,增加了多个章节讲述最新的数据挖掘方法,以便能够挖掘出复杂类型的数据,包括流数据、序列数据、图结构数据、社会网络数据和多重关系数据。本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材,同时也适宜作为数据挖掘研究人员和相关专业人士的参考书。本书特点: ● 全面实用地论述了从实际业务数据中抽取出读者需要的概念和技术。 ● 结合读者的反馈,反映数据挖掘领域的技术变化以及统计和机器学习方面的进展。 ● 引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。
-
数据库与数据仓库实用操作大全(美)David Iseminger本书集中讲述了数据库的创建和维护、数据仓库的创建和SQL Server 2000的优化。并对SQL Server 2000的数据库、表格、索引、视图、固定程序、触发器、用户自定义函数和全文本索引等都有全面的阐述。同时也详述了数据仓库听组成、创建和维护,以及如何通过有效的数据库和应用程序设计、查询调试和优化工具、实用程序和性能良好的服务器等来提高数据库的性能。本书由经验丰富的微软专家编写,内容全面,言简意赅,是从事数据库与数据仓库管理者的理想参考书。
-
程序员大本营系列程序员杂志社我们精心挑选并翻译了一批国外最前沿技术文章,范围涉及各个主流数据如Oracle、MSSQL、Sybase的选型、比较、设计、数据库管理,性能优化,此外还有一批国内资深数据库领域作者撰写的优秀文章,再加上书后的SQL命令速查手册以及经过仔细挑选的数据库FAQ,帮助你快速而深入的理解数据库方方面面各种知识。30余万字高密度技术知识,绝对值得你仔细琢磨体会。
-
数据挖掘原理与应用(美)唐(Tang,Z.H.),(美)麦克雷南(MaccLennan,J.) 著,邝祝芳,焦贤龙,高升 译本书作为一本专家级指南,全面介绍了SQL Server 2005中数据挖掘的功能,并且对这些功能的应用作了较为详尽的讲述。书中不但讲述了数据挖掘的核心概念,还讲述了数据挖掘的最新发展趋势,并给出了一些数据挖掘的最佳实践。...
-
数据挖掘技术朱玉全、杨鹤标、孙蕾数据采集和存储技术的进步导致了数据规模的日益增加,数据是一种宝贵的信息资源,但这种资源同矿藏一样,只有通过管理、分析、挖掘、提炼等操作,才能使潜在的资源变成可用的财富。 本书系统地介绍了数据挖掘技术的产生、发展、应用及相关原理和算法,其主要内容包括:数据挖掘基本知识、数据挖掘处理流程、数据仓库和联机分析处理、关联规则发现方法、序列模式挖掘方法、决策树分类方法、贝叶斯分类法、各种聚类方法、Web挖掘以及分类方法在医学图像中的应用。本书包含了作者多年来在数据挖掘中的研究成果。 本书可作为计算机专业、自动化专业、生物医学专业等高年级本科生与研究生课程的教材,也可作为需要了解数据挖掘有关方法与技术的研究、设计和开发人员的参考书。