数据库挖掘/数据仓库
-
MongoDB管理与开发精要红丸 著《MongoDB管理与开发精要》内容有三大特点:系统而全面,内容包含MongoDB开发、管理、维护和性能优化等方方面面;详细而深入,不仅对MongoDB的开发和管理方法进行了详尽的讲解,而且还对MongoDB的工作机制进行了深入的剖析;注重实战,尝试通过实践中的案例来帮助读者理解使用MongoDB数据库时遇到的各种问题的症结之所在,并给出了解决方案。本书一共分为六篇:一基础篇,主要讲解了MongoDB的基础理论和基本操作,学习完这部分内容可以掌握MongoDB的基本操作;二高级篇,讲解了高级查询、高级更新、高级功能应用等MongoDB的高级技术,掌握这部分内容后就能熟练地应用MongoDB来完成日常的工作;三管理篇,详细介绍了MongoDB常用的运维管理工具、各种管理命令以及访问控制方面的技术,掌握这部分内容后就能具备一位MongoDB DBA所具有的全部技能;四性能篇,详细阐述了MongoDB的索引、优化,以及性能监控方面的知识,这部分内容将使读者具备对MongoDB进行调优的能力;五架构篇,重点讲解了主从复制、分片等高可用架构的细节,掌握这部分内容后就可以独立设计出MongoDB应用系统的架构;六开发篇,讲解了如何用C#和Java来操作MongoDB数据库,掌握这部分内容后就可以将C#和Java开发技术与MongoDB数据库结合起来,从而完成特定应用系统的开发。
-
数据挖掘基础与应用谢邦昌 编著《数据挖掘基础与应用(SQL Server 2008)》介绍了数据挖掘技术,然后虚拟一个“邦邦超市”,通过使用SQL语言建立该超市的数据库并对数据进行操作,再进一步利用SQLServer2008的数据挖掘模型对超市积累的数据进行挖掘,以实际例子帮助读者迅速理解并掌握数据挖掘技术,学会使用SQLServer2008提供的数据挖掘工具,提高零售企业的信息利用能力和经营水平。对于想要了解数据挖掘技术及其应用的读者,《数据挖掘基础与应用(SQL Server 2008)》是很好的参考读物。
-
数据与文本挖掘及其在研发决策中的应用郝占刚 著数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。《数据与文本挖掘及其在研发决策中的应用》研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中。所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索弓I进行文本特征降维;采用社会演化算法进行聚类;采用混;屯社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
-
数据挖掘算法与应用黄添强 著数据挖掘是近年来计算机科学中最活跃的研究分支之一。《数据挖掘算法与应用》分三部分介绍数据挖掘中的三个热点:空间数据挖掘、半监督学习与流形学习,并分别介绍了这三个研究热点的研究背景、研究现状、存在问题、最新算法与应用等。《数据挖掘算法与应用》在论述这三个研究热点的研究现状并分析了存在的问题后,面向实际需要,提出最新的模型、算法与技术。这些模型与算法以作者研究成果为基础,具有一定的创新性与实际应用价值。这些成果可帮助广大研究工作者与工程技术人员拓展思路,并为数据挖掘的理论应用提供借鉴。《数据挖掘算法与应用》可供数据挖掘、机器学习及相关专业的研究人员、教师、研究生和工程人员参考。
-
数据仓库与数据挖掘教程陈文伟 编著数据仓库与数据挖掘是决策支持的两项重要技术,它们共同的特点是都需要利用大量的数据资源,并从数据资源中提取信息和知识。由于数据资源丰富,因此数据仓库与数据挖掘的决策支持效果显著。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘教程(第2版)》系统介绍数据仓库原理,联机分析处理,数据仓库设计与开发,数据仓库的决策支持,数据挖掘原理,基于信息论的决策树方法,基于集合论的粗糙集方法、K-均值聚类、关联规则挖掘,仿生物技术的神经网络,遗传算法,公式发现,知识挖掘,文本挖掘与Web挖掘。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘教程(第2版)》从数据仓库的兴起来说明决策支持的特点,从数据挖掘的理论基础来说明数据挖掘的方法,并通过实例来详细讲解。希望读者在学习之后,亲自在计算机上去实践,这样才能更有效地掌握数据挖掘的方法。
-
空间数据挖掘及其相关问题研究张志兵 著《空间数据挖掘及其相关问题研究》围绕空间数据挖掘的相关技术进行了卓有成效的研究。首先,研究了数据聚类有关问题;接着,提出了一个改进的支持大的数据集和任意形状聚类、且具有良好的抗噪性能和能满足高维数据要求的算法;然后,分析了与空间数据挖掘和分析相关的空间索引及查询技术;最后,设计了一个融合神经网络、模糊集和遗传算法的空间数据挖掘系统。《空间数据挖掘及其相关问题研究》可作为人工智能、模式识别、空间数据库、统计学、空间信息系统和网络等学科相关专业学生的教材及参考资料。
-
Hadoop实战(美) 拉姆 (Lam,C.) 著 ; 韩冀中译作为云计算所青睐的分布式架构,Hadoop 是一个用Java 语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。本书分为3 个部分,深入浅出地介绍了Hadoop 框架、编写和运行Hadoop 数据处理程序所需的实践技能及Hadoop 之外更大的生态系统。《Hadoop实战》适合需要处理大量离线数据的云计算程序员、架构师和项目经理阅读参考。
-
数据挖掘原理与实践蒋盛益,李霞,郑琪 编著《高等学校计算机规划教材:数据挖掘原理与实践》分为数据挖掘理论和数据挖掘实践两大部分。基础理论部分的主要内容包括数据挖掘的基本概念、数据挖掘的预处理、聚类分析、分类与回归、关联规则挖掘、例外点检测。数据挖掘实践部分讨论了数据挖掘在通信行业、文本挖掘等方面的实际应用;通过四个案例展示了在通信行业中如何利用数据挖掘进行客户细分、客户流失分析、客户社会关系挖掘、业务交叉销售;通过跨语言智能学术搜索系统和基于内容的垃圾邮件识别两个案例展示了数据挖掘在文本挖掘方面的应用。《高等学校计算机规划教材:数据挖掘原理与实践》可作为高等院校计算机电子商务及相关专业的学生相关的教材或参考书,也可供从事数据挖掘研究、设计等工作的科研、技术人员参考。
-
粒度计算在数据挖掘中的应用研究张霞 著张霞的这本《粒度计算在数据挖掘中的应用研究》对模糊粒度计算在文本软聚类中的应用进行了深入研究,提出了一种基于模糊粒度计算的聚类方法,并且利用该聚类方法对K-means算法进行了优化。基于模糊粒度计算的聚类是通过归一化的距离函数将聚类问题映射到距离空间,调节粒度产生对文本集合D的动态聚类划分。动态聚类既可以作为一个单独的聚类结果,也可以作为其他算法的一个预处理步骤。K-means算法是一种经典的聚类算法,速度快、消耗资源小,但是算法对初始聚类中心点敏感,容易陷入局部最小值。《粒度计算在数据挖掘中的应用研究》将基于模糊粒度计算的聚类方法作为K-means算法的预处理步骤,实验结果证明,这种预处理有效地消除了K-means算法的初始值敏感问题,优化了K-means算法。
-
标准信息挖掘刘华 著随着互联网及相应信息技术的广泛应用,标准信息检索也相应地发生变化,网络作为检索平台。信息化建社在文献管理中的作用越来越大,各级图书馆、档案馆、资料室等文献机构均需进行信息化建设,刘华所著的《标准信息挖掘——理论、方法与应用》提供了具体的方法,介绍了标准文献的信息挖掘和信息处理的理论、方法、模型及其应用等。