数据库挖掘/数据仓库
-
大数据李志刚 主编不管你愿意不愿意,我们每天都在制造和分享数据;不管你关心不关心,我们已经生活在大数据的包围之中。大数据,这个在2012年突然火爆起来的词汇,我们究竟该如何解读?本书介绍了大数据产生的背景、特征和发展趋势,从实证的角度探讨了它对社会和商业智能的影响,并认为大数据正影响着商业模式的转变,将带来新的商业机会。能否对大数据进行处理、分析与整合将成为提升企业核心竞争力的关键!大数据,既是一场大机遇,也将引发一场大变革! -
土地资源评价数据挖掘方法与应用胡月明,张俊平 著《土地资源评价数据挖掘方法与应用》从土地资源评价数据库建立、评价指标体系确定及指标权值制定、样本容量的计算、土地质量等级评定入手,系统地研究了数据挖掘技术在土地资源评价各主要环节中的应用。全书详细地对土地资源评价方法进行了综述和展望,简明阐述了数据挖掘的概念和一般程序;介绍了因子分析、层次分析、模糊层次分析、灰色关联综合分析和BP神经网络方法,及其在指标权值制定中的应用;引进了抽样技术解决了样本容量的确定;应用K-均值聚类分析,二步聚类分析、模糊综合评判和模糊聚类分析等方法,实现了土地质量的无监督学习分类;采用Fisher判别分析、Logistic多元回归分析、决策树分析、BP神经网络模型、径向基概率神经网络模型和支持向量机等方法,对土地质量进行了有监督学习分类。 -
大数据(美) Anand Rajaraman (美) Jeffrey David Ullman 著,王 斌 译本书源自作者在斯坦福大学教授多年的“Web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前Web应用的许多重要话题。主要内容包括:□ 分布式文件系统以及Map-Reduce工具;□ 相似性搜索;□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;□ 搜索引擎技术,如谷歌的PageRank;□ 频繁项集挖掘;□ 大规模高维数据集的聚类算法;□ Web应用中的关键问题:广告管理和推荐系统。本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。 -
CouchDB权威指南(美)J.Chris Anderson,(美)Jan Lehnardt,(美) Noah Slater 著 来诺 译三位CouchDB的开发者向你展示了如何以独立应用框架的形式来使用这一面向文档的数据库,以及如何使用它来构建高容量、分布式的应用。 CouchDB简洁的存储,处理,以及读取数据的模型,让它成为了构建处理海量松散结构数据的Web应用的理想选择。 在这一点上它就超越了关系型数据库的各种限制,并且CouchDB提供了一个可靠的,易扩展的且响应快速的开源解决方案。 CouchDB使用自包含的数据,它们拥有松散的或者特定的联系。这是一个适合于许多现实世界物品的模型,比如通讯录、发票和收据。 但你会发现这个数据库能够轻松的处理任何形式的数据。 通过《CouchDB权威指南》,你将学会如何通过CouchDB的RESTful Web接口来使用它,此外你还会熟悉CouchDB的一些主要特性,比如简单的文档的CRUD(创建、读取、更新、删除); 高级的MapReduce,部署优化等更多的内容。 * 理解面向文档存储和操作的基础知识。 * 通过HTTP,使用CouchDB的RESTful接口来与其进行交互。 * 以自包含的JSON文档的形式来建模数据。 * 自然的处理不断变化的数据模型。 * 使用MapReduce视图来查询和综合CouchDB中的数据。 * 在节点间进行复制。 * 优化CouchDB来适应不断提高的性能和可靠性要求。 -
数据仓库与数据挖掘导论李於洪 主编《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。第一篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实验、决策树与关联分析实验,强化培养学生的应用能力。《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》可作为普通高等院校计算机专业、软件工程专业、信管专业等其他相关专业的教材,也可作为数据仓库与数据挖掘方面的培训教材,对于希望了解或学习数据仓库与数据挖掘知识的自学人士,本书具有较强的可读性。 -
数据挖掘(美)Jiawei Han 等 著 范明,孟小峰 译《数据挖掘:概念与技术(原书第3版)》完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。《数据挖掘:概念与技术(原书第3版)》是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。 -
数据挖掘理论与实例王晖 等 著《数据挖掘理论与实例》是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。《数据挖掘理论与实例》的主要目标是,通过不同领域的应用案例来说明数据挖掘在实际应用中的具体操作方法。将数据库管理系统MySQL和统计软件R结合,利用数据挖掘技术帮助陷入海量数据中的组织和个人提取有用的信息。《数据挖掘理论与实例》的主要内容包括理论和实例两部分:第一、第二章介绍数据挖掘、数据仓库和数据挖掘的常用技术等基本理论;实例部分是以作者的两个研究课题为基础,第三、第四章介绍呼叫中心数据仓库的构建和数据挖掘模型与实现(MSSQLServer2000、决策树);第五、第六章介绍数据挖掘在QFII投资理念与持股偏好研究中的应用(Rsoft-ware、MySQL、多元逐步线性回归、因子分析、聚类分析等)。 -
技术挖掘与专利分析(美)波特,(美)坎宁安 著,陈燕 等译《技术挖掘与专利分析》讲述如何从技术和市场信息特别是专利信息中挖掘获得潜在的竞争情报,从介绍技术挖掘的基础概念、原理开始,讲解数据采集、基本分析、高级分析、趋势分析、专利分析的方法和技巧,给出技术挖掘指标组合,并结合具体案例指出技术挖掘过程中的注意事项,帮助读者了解技术挖掘流程和掌握技术挖掘方法。《技术挖掘与专利分析》还列出了可供选择使用的科技数据库、技术挖掘软件的资源清单,为有意实际进行技术挖掘的读者提供了指引。《技术挖掘与专利分析》可作为技术研究人员,使用技术成果的分析人员和直接从事管理的人员的指导书,也可以作为技术分析机构和研究生课程的参考书。 -
数据挖掘Ian H. Witten 等 著Ian H. Witten, Eibe Frank and Mark A. Hall: Data Mining: Practical Machine Learning Tools and Techniques, Third Edition (ISBN 978-0-12-374856-0). Original English language edition copyright2011 by Elsevier Inc. All rights reserved. Authorized English language reprint edition published by the Proprietor. Copyright2012 by Elsevier (Singapore) Pte Ltd. Printed in China by China Machine Press under special arrangement with Elsevier (Singapore) Pte Ltd. This edition is authorized for sale in China only, excluding Hong Kong, Macao SARs and Taiwan. Unauthorized export of this edition is a violation of the Copyright Act. Violation of this Law is subject to Civil and Criminal Penalties. -
数据挖掘(美)韩家炜,(加)坎伯,(加)裴健 著当代商业和科学领域大量激增的数据量要求我们采用更加复杂和精细的工具来进行数据分析、处理和挖掘。尽管近年来数据挖掘技术取得的长足进展使得我们广泛收集数据越来越容易,但技术的发展依然难以匹配爆炸性的数据增长以及随之而来的大量数据处理需求,因此我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。每章都针对关键专题有单独的指导,提供最佳算法,并对怎样将技术运用到实际工作中给出了经过实践检验的实用型规则。如果你希望自己能熟练掌握和运用当今最有力的数据挖掘技术,那这本书正是你需要阅读和学习的宝贵资源。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的一本书。本书特点引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。讨论了一些高级主题,例如挖掘面向对象的关系型数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库、万维网以及其他领域的应用等。全面而实用地给出用于从海量数据中获取尽可能多信息的概念和技术。
