数据库挖掘/数据仓库
-
基于Clementine的数据挖掘薛薇 等编著数据挖掘这种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。clementine软件以其卓越的运算处理能力和图形展现能力、优秀的算法、行之有效的统计分析方法成为解决数据挖掘问题的理想工具。作者基于长期从事计算机数据分析教学与科研工作的经验编写了本书,在编写过程中体现出以下特色:·以数据挖掘过程为线索介绍clementine软件。本书以数据挖掘的实践过程为主线,从clementine数据管理入手,说明问题从浅至深,讲解方法从易到难。这样,能使读者在较短时间内掌握clementine的基本功能和一般方法,并可迅速运用到实际工作中。·数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例,侧重数据挖掘方法核心思想和基本原理的阐述,使得读者可以直观理解方法,并正确掌握方法的应用范围。·数据挖掘方法讲解全面,语言通俗。本书对clementine的数据挖掘算法进行了全面分析和应用,内容力求丰富翔实。同时使用通俗的语言和示例讲述算法,尽量避免使用公式和推导堆砌算法。 -
技术挖掘与专利分析(美)波特,(美)坎宁安 著,陈燕 等译《技术挖掘与专利分析》讲述如何从技术和市场信息特别是专利信息中挖掘获得潜在的竞争情报,从介绍技术挖掘的基础概念、原理开始,讲解数据采集、基本分析、高级分析、趋势分析、专利分析的方法和技巧,给出技术挖掘指标组合,并结合具体案例指出技术挖掘过程中的注意事项,帮助读者了解技术挖掘流程和掌握技术挖掘方法。《技术挖掘与专利分析》还列出了可供选择使用的科技数据库、技术挖掘软件的资源清单,为有意实际进行技术挖掘的读者提供了指引。《技术挖掘与专利分析》可作为技术研究人员,使用技术成果的分析人员和直接从事管理的人员的指导书,也可以作为技术分析机构和研究生课程的参考书。 -
数据挖掘理论与实例王晖 等 著《数据挖掘理论与实例》是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。《数据挖掘理论与实例》的主要目标是,通过不同领域的应用案例来说明数据挖掘在实际应用中的具体操作方法。将数据库管理系统MySQL和统计软件R结合,利用数据挖掘技术帮助陷入海量数据中的组织和个人提取有用的信息。《数据挖掘理论与实例》的主要内容包括理论和实例两部分:第一、第二章介绍数据挖掘、数据仓库和数据挖掘的常用技术等基本理论;实例部分是以作者的两个研究课题为基础,第三、第四章介绍呼叫中心数据仓库的构建和数据挖掘模型与实现(MSSQLServer2000、决策树);第五、第六章介绍数据挖掘在QFII投资理念与持股偏好研究中的应用(Rsoft-ware、MySQL、多元逐步线性回归、因子分析、聚类分析等)。 -
数据仓库与数据挖掘导论李於洪 主编《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。第一篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实验、决策树与关联分析实验,强化培养学生的应用能力。《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》可作为普通高等院校计算机专业、软件工程专业、信管专业等其他相关专业的教材,也可作为数据仓库与数据挖掘方面的培训教材,对于希望了解或学习数据仓库与数据挖掘知识的自学人士,本书具有较强的可读性。 -
数据挖掘(美)Jiawei Han 等 著 范明,孟小峰 译《数据挖掘:概念与技术(原书第3版)》完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。《数据挖掘:概念与技术(原书第3版)》是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。 -
大数据(美) Anand Rajaraman (美) Jeffrey David Ullman 著,王 斌 译本书源自作者在斯坦福大学教授多年的“Web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前Web应用的许多重要话题。主要内容包括:□ 分布式文件系统以及Map-Reduce工具;□ 相似性搜索;□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;□ 搜索引擎技术,如谷歌的PageRank;□ 频繁项集挖掘;□ 大规模高维数据集的聚类算法;□ Web应用中的关键问题:广告管理和推荐系统。本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。 -
CouchDB权威指南(美)J.Chris Anderson,(美)Jan Lehnardt,(美) Noah Slater 著 来诺 译三位CouchDB的开发者向你展示了如何以独立应用框架的形式来使用这一面向文档的数据库,以及如何使用它来构建高容量、分布式的应用。 CouchDB简洁的存储,处理,以及读取数据的模型,让它成为了构建处理海量松散结构数据的Web应用的理想选择。 在这一点上它就超越了关系型数据库的各种限制,并且CouchDB提供了一个可靠的,易扩展的且响应快速的开源解决方案。 CouchDB使用自包含的数据,它们拥有松散的或者特定的联系。这是一个适合于许多现实世界物品的模型,比如通讯录、发票和收据。 但你会发现这个数据库能够轻松的处理任何形式的数据。 通过《CouchDB权威指南》,你将学会如何通过CouchDB的RESTful Web接口来使用它,此外你还会熟悉CouchDB的一些主要特性,比如简单的文档的CRUD(创建、读取、更新、删除); 高级的MapReduce,部署优化等更多的内容。 * 理解面向文档存储和操作的基础知识。 * 通过HTTP,使用CouchDB的RESTful接口来与其进行交互。 * 以自包含的JSON文档的形式来建模数据。 * 自然的处理不断变化的数据模型。 * 使用MapReduce视图来查询和综合CouchDB中的数据。 * 在节点间进行复制。 * 优化CouchDB来适应不断提高的性能和可靠性要求。 -
土地资源评价数据挖掘方法与应用胡月明,张俊平 著《土地资源评价数据挖掘方法与应用》从土地资源评价数据库建立、评价指标体系确定及指标权值制定、样本容量的计算、土地质量等级评定入手,系统地研究了数据挖掘技术在土地资源评价各主要环节中的应用。全书详细地对土地资源评价方法进行了综述和展望,简明阐述了数据挖掘的概念和一般程序;介绍了因子分析、层次分析、模糊层次分析、灰色关联综合分析和BP神经网络方法,及其在指标权值制定中的应用;引进了抽样技术解决了样本容量的确定;应用K-均值聚类分析,二步聚类分析、模糊综合评判和模糊聚类分析等方法,实现了土地质量的无监督学习分类;采用Fisher判别分析、Logistic多元回归分析、决策树分析、BP神经网络模型、径向基概率神经网络模型和支持向量机等方法,对土地质量进行了有监督学习分类。 -
大数据李志刚 主编不管你愿意不愿意,我们每天都在制造和分享数据;不管你关心不关心,我们已经生活在大数据的包围之中。大数据,这个在2012年突然火爆起来的词汇,我们究竟该如何解读?本书介绍了大数据产生的背景、特征和发展趋势,从实证的角度探讨了它对社会和商业智能的影响,并认为大数据正影响着商业模式的转变,将带来新的商业机会。能否对大数据进行处理、分析与整合将成为提升企业核心竞争力的关键!大数据,既是一场大机遇,也将引发一场大变革! -
预测性文本挖掘基础(美) 绍洛姆·韦斯(Sholom M.Weiss) (澳)尼亭·因杜尔亚(Nitin Indurkhya)(美)张潼(Tong zhang),赵仲孟 侯, 迪 译电脑普及带来的一个结果是文档以数字形式呈现出来,加之Internet的广泛使用,这些文档就变得唾手可得。文本挖掘,即对非结构化的自然语言文本的分析过程,主要针对的是如何从这些文档中提取信息。《预测性文本挖掘基础》是一本入门级的教科书,是在修订施普林格已经成功出版的文本挖掘领域的参考书基础上得到的,旨在能够帮助读者了解这个快速发展的领域。同时,该书也整合了包括数据挖掘、机器学习、数据库以及计算语言学方面很多的理论,因此这本独一无二的书也提供了一些文本挖掘方面比较实用的建议。书中深层次地讨论了文档分类、信息检索、聚类和组织文档、信息提取、基于web的数据源的预测和评价问题。要学习《预测性文本挖掘基础》,如果读者有数据挖掘方面的知识自然很好,但这并不是必须的。书中有些地方涉及到一些高级概念,这些需要读者有一定的数学功底,当然我们也提供了一些直观上的解释来帮助那些非专业读者。
