数据库挖掘/数据仓库
-
数据与文本挖掘及其在研发决策中的应用郝占刚 著数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。《数据与文本挖掘及其在研发决策中的应用》研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中。所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索弓I进行文本特征降维;采用社会演化算法进行聚类;采用混;屯社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。 -
SAS统计分析与数据挖掘谢龙汉,尚涛 编著《SAS统计分析与数据挖掘》基于SAS 9.2版本编写,从SAS编程出发,用案例形式介绍SAS数据挖掘在各领域的广泛应用,全书分为SAS基础篇、提高篇及应用篇,每章均给出大量分析案例。具体内容为SAS软件与数据挖掘简介,SAS编程基础,图形与报表制作,描述性分析,假设检验,回归分析,方差分析与因子分析,相关分析与对应分析,判别分析,聚类分析,生存分析,时间序列分析,以及SAS在具体数据挖掘项目中的应用等。《SAS统计分析与数据挖掘》最大特点是抛弃了其他同类书籍中只说理论、缺少案例分析的弊病,全书给出大量数据挖掘分析案例,为读者展示SAS在数据整合、数据挖掘、商业智能、金融数据分析、金融风险管理等项目中的强大应用技术。配套光盘中有实例的操作视频以及相关源程序文件。 -
数据挖掘原理、算法及应用李爱国,厍向阳 编著《高等学校计算机专业“十二五”规划教材:数据挖掘原理、算法及应用》以各类数据挖掘算法为核心,以智能数据分析技术的发展为主线,结合作者自身的研究和应用经验,阐述数据挖掘研究领域的主要理论和典型算法。全书共分8章:第1章为绪论;第2-5章分别介绍数据挖掘的主要技术、各类典型算法及其编程实现,包括数据预处理技术,关联规则挖掘技术、分类技术,聚类技术等几大类技术和其中包含的典型算法;第6-8章分别简要介绍一些数据挖掘的应用专题,包括时间序列数据挖掘、Weh挖掘、空间数据挖掘等。 -
数据挖掘导论朱明 编著与十年前相比,数据挖掘作为数据分析与决策支持的重要技术,已在各行各业得到了更为广泛的应用。随着网络和IT技术的不断发展,数据挖掘应用必将更加深入和普及。作者根据自己十多年教授“数据挖掘”课程的经验积累,编写了这本教材。《数据挖掘导论》全面系统地介绍了数据挖掘的主要方法,并配有许多应用案例,使得读者能够更加容易地理解这些数据挖掘方法。同时《数据挖掘导论》每章后还配有许多思考题,使得这本书更适合作为“数据挖掘”课程的教材。本书的主要内容包括数据挖掘概述、数据仓库与在线分析、分类挖掘、关联挖掘、聚类挖掘、异类挖掘、数据流挖掘、文本挖掘以及数据挖掘应用与数据挖掘云等。本书适合作为高等院校高年级本科生、研究生相关课程的教材或参考书。对从事数据挖掘应用的技术人员以及希望了解数据挖掘方法与应用的广大数据挖掘用户,本书也具有一定的参考价值。 -
MongoDB管理与开发精要红丸 著《MongoDB管理与开发精要》内容有三大特点:系统而全面,内容包含MongoDB开发、管理、维护和性能优化等方方面面;详细而深入,不仅对MongoDB的开发和管理方法进行了详尽的讲解,而且还对MongoDB的工作机制进行了深入的剖析;注重实战,尝试通过实践中的案例来帮助读者理解使用MongoDB数据库时遇到的各种问题的症结之所在,并给出了解决方案。本书一共分为六篇:一基础篇,主要讲解了MongoDB的基础理论和基本操作,学习完这部分内容可以掌握MongoDB的基本操作;二高级篇,讲解了高级查询、高级更新、高级功能应用等MongoDB的高级技术,掌握这部分内容后就能熟练地应用MongoDB来完成日常的工作;三管理篇,详细介绍了MongoDB常用的运维管理工具、各种管理命令以及访问控制方面的技术,掌握这部分内容后就能具备一位MongoDB DBA所具有的全部技能;四性能篇,详细阐述了MongoDB的索引、优化,以及性能监控方面的知识,这部分内容将使读者具备对MongoDB进行调优的能力;五架构篇,重点讲解了主从复制、分片等高可用架构的细节,掌握这部分内容后就可以独立设计出MongoDB应用系统的架构;六开发篇,讲解了如何用C#和Java来操作MongoDB数据库,掌握这部分内容后就可以将C#和Java开发技术与MongoDB数据库结合起来,从而完成特定应用系统的开发。 -
数据挖掘基础与应用谢邦昌 编著《数据挖掘基础与应用(SQL Server 2008)》介绍了数据挖掘技术,然后虚拟一个“邦邦超市”,通过使用SQL语言建立该超市的数据库并对数据进行操作,再进一步利用SQLServer2008的数据挖掘模型对超市积累的数据进行挖掘,以实际例子帮助读者迅速理解并掌握数据挖掘技术,学会使用SQLServer2008提供的数据挖掘工具,提高零售企业的信息利用能力和经营水平。对于想要了解数据挖掘技术及其应用的读者,《数据挖掘基础与应用(SQL Server 2008)》是很好的参考读物。 -
化学数据挖掘方法与应用陆文聪 等著《化学数据挖掘方法与应用》主要介绍了化学常用数据挖掘方法和技术的基本原理,并重点介绍了模式识别、支持向量机、集成学习方法在材料设计、工业优化、构效关系、生物信息学等领域的应用研究实例。书中所有应用研究实例全部取自作者的应用研究课题,有关算法程序可采用作者开发的应用软件HyperMiner(见附录1)。《化学数据挖掘方法与应用》可供化学、化工及相关领域的科研人员和工程技术人员阅读,亦可作为高等学校的教学参考书。 -
社交网站的数据挖掘与分析(美)罗塞尔 著,师蓉 译Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。本书每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。通过本书,你将 . 获得对社交网络世界的直观认识 .使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn等社交网络API中的数据 . 学习如何应用便捷的Python工具来交叉分析你所收集的数据 . 通过XFN探讨基于微格式的社交联系 . 应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术 . 通过基于HTML 5和JavaScript工具包的网络技术建立交互式可视化 -
数据挖掘Ian H. Witten 等 著Ian H. Witten, Eibe Frank and Mark A. Hall: Data Mining: Practical Machine Learning Tools and Techniques, Third Edition (ISBN 978-0-12-374856-0). Original English language edition copyright2011 by Elsevier Inc. All rights reserved. Authorized English language reprint edition published by the Proprietor. Copyright2012 by Elsevier (Singapore) Pte Ltd. Printed in China by China Machine Press under special arrangement with Elsevier (Singapore) Pte Ltd. This edition is authorized for sale in China only, excluding Hong Kong, Macao SARs and Taiwan. Unauthorized export of this edition is a violation of the Copyright Act. Violation of this Law is subject to Civil and Criminal Penalties. -
数据挖掘(美)韩家炜,(加)坎伯,(加)裴健 著当代商业和科学领域大量激增的数据量要求我们采用更加复杂和精细的工具来进行数据分析、处理和挖掘。尽管近年来数据挖掘技术取得的长足进展使得我们广泛收集数据越来越容易,但技术的发展依然难以匹配爆炸性的数据增长以及随之而来的大量数据处理需求,因此我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。每章都针对关键专题有单独的指导,提供最佳算法,并对怎样将技术运用到实际工作中给出了经过实践检验的实用型规则。如果你希望自己能熟练掌握和运用当今最有力的数据挖掘技术,那这本书正是你需要阅读和学习的宝贵资源。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的一本书。本书特点引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。讨论了一些高级主题,例如挖掘面向对象的关系型数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库、万维网以及其他领域的应用等。全面而实用地给出用于从海量数据中获取尽可能多信息的概念和技术。
