数据库挖掘/数据仓库
-
大数据挑战与NoSQL数据库技术陆嘉恒 著《大数据挑战与NoSQL数据库技术》共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入NoSQL数据库;系统篇主要介绍了各种类型NoSQL数据库的基本知识;应用篇对国内外几家知名公司在利用NoSQL数据库处理海量数据方面的实践做了阐述。《大数据挑战与NoSQL数据库技术》对大数据时代面临的挑战,以及NoSQL数据库的基本知识做了清晰的阐述,有助于读者整理思路,了解需求,并更有针对性、有选择地深入学习相关知识。
-
数据挖掘理论与技术罗森林,马俊,潘丽敏 编著《数据挖掘理论与技术》梳理了数据挖掘理论与技术的 知识点,注重领域内核心思想、原理、方法的论述及国内外最 新研究进展的融入,内容上系统、全面、先进。全书共9章,主要包括数据 挖掘基础知识,概率论与 数理统计,数据挖掘效果评价,数据预处理,数据仓库,数据分类分析,数据聚类分析,关联规则发 现,统计预测方法等。在讨论算法的同时引入应用实例,强调应用方法包 括算法特点、参数选择、结 果评价等方面的分析,理论联系实际,有利于算法的快速掌握和有效运用。《数据挖掘理论与技术》可供计算机科学与技术、生命信息工程、软 件工程、通信与信息系统等相关学科、专业的学 生作为教材或参考书,同时也可供科研人员参考和感兴趣者自学使用。
-
驾驭大数据(美)Bill Franks 著 黄海,车皓阳,王悦 等 译《驾驭大数据》为读者提供了处理大数据和在你的企业中培养一种创新和发现的文化所需的工具、过程和方法,描绘了一个易于实施的行动计划,以帮助你的企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。本书主要介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。《驾驭大数据》适于所有对数据、数据挖掘、数据分析感兴趣的技术人员和决策者阅读。
-
预测性文本挖掘基础(美) 绍洛姆·韦斯(Sholom M.Weiss) (澳)尼亭·因杜尔亚(Nitin Indurkhya)(美)张潼(Tong zhang),赵仲孟 侯, 迪 译电脑普及带来的一个结果是文档以数字形式呈现出来,加之Internet的广泛使用,这些文档就变得唾手可得。文本挖掘,即对非结构化的自然语言文本的分析过程,主要针对的是如何从这些文档中提取信息。《预测性文本挖掘基础》是一本入门级的教科书,是在修订施普林格已经成功出版的文本挖掘领域的参考书基础上得到的,旨在能够帮助读者了解这个快速发展的领域。同时,该书也整合了包括数据挖掘、机器学习、数据库以及计算语言学方面很多的理论,因此这本独一无二的书也提供了一些文本挖掘方面比较实用的建议。书中深层次地讨论了文档分类、信息检索、聚类和组织文档、信息提取、基于web的数据源的预测和评价问题。要学习《预测性文本挖掘基础》,如果读者有数据挖掘方面的知识自然很好,但这并不是必须的。书中有些地方涉及到一些高级概念,这些需要读者有一定的数学功底,当然我们也提供了一些直观上的解释来帮助那些非专业读者。
-
大话数据挖掘西安美林电子有限责任公司 编著《大话数据挖掘》以EMBA班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:第1章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。数据挖掘是一种专业性极强的技术,本书避开大量晦涩的概念和令人生畏的数学公式,以师生互动讨论的形式让读者走进数据挖掘殿堂,进而深入浅出、循序渐进地感知数据挖掘。随着阅读,读者会自然而然地身临课堂,“让数据说话,从数据中发现规律,科学决策”等新的理念会使读者对实际工作中面临的复杂问题浮想联翩、另辟新径。《大话数据挖掘》适合企事业部门的领导、管理人员、生产一线的技术人员,另外,学生或者行业工作者,可以通过本书的阅读,为以后的学习奠定好基础。
-
数据仓库与数据挖掘导论李於洪 主编《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。第一篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实验、决策树与关联分析实验,强化培养学生的应用能力。《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》可作为普通高等院校计算机专业、软件工程专业、信管专业等其他相关专业的教材,也可作为数据仓库与数据挖掘方面的培训教材,对于希望了解或学习数据仓库与数据挖掘知识的自学人士,本书具有较强的可读性。
-
土地资源评价数据挖掘方法与应用胡月明,张俊平 著《土地资源评价数据挖掘方法与应用》从土地资源评价数据库建立、评价指标体系确定及指标权值制定、样本容量的计算、土地质量等级评定入手,系统地研究了数据挖掘技术在土地资源评价各主要环节中的应用。全书详细地对土地资源评价方法进行了综述和展望,简明阐述了数据挖掘的概念和一般程序;介绍了因子分析、层次分析、模糊层次分析、灰色关联综合分析和BP神经网络方法,及其在指标权值制定中的应用;引进了抽样技术解决了样本容量的确定;应用K-均值聚类分析,二步聚类分析、模糊综合评判和模糊聚类分析等方法,实现了土地质量的无监督学习分类;采用Fisher判别分析、Logistic多元回归分析、决策树分析、BP神经网络模型、径向基概率神经网络模型和支持向量机等方法,对土地质量进行了有监督学习分类。
-
大数据李志刚 主编不管你愿意不愿意,我们每天都在制造和分享数据;不管你关心不关心,我们已经生活在大数据的包围之中。大数据,这个在2012年突然火爆起来的词汇,我们究竟该如何解读?本书介绍了大数据产生的背景、特征和发展趋势,从实证的角度探讨了它对社会和商业智能的影响,并认为大数据正影响着商业模式的转变,将带来新的商业机会。能否对大数据进行处理、分析与整合将成为提升企业核心竞争力的关键!大数据,既是一场大机遇,也将引发一场大变革!
-
大数据(美) Anand Rajaraman (美) Jeffrey David Ullman 著,王 斌 译本书源自作者在斯坦福大学教授多年的“Web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前Web应用的许多重要话题。主要内容包括:□ 分布式文件系统以及Map-Reduce工具;□ 相似性搜索;□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;□ 搜索引擎技术,如谷歌的PageRank;□ 频繁项集挖掘;□ 大规模高维数据集的聚类算法;□ Web应用中的关键问题:广告管理和推荐系统。本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。
-
CouchDB权威指南(美)J.Chris Anderson,(美)Jan Lehnardt,(美) Noah Slater 著 来诺 译三位CouchDB的开发者向你展示了如何以独立应用框架的形式来使用这一面向文档的数据库,以及如何使用它来构建高容量、分布式的应用。 CouchDB简洁的存储,处理,以及读取数据的模型,让它成为了构建处理海量松散结构数据的Web应用的理想选择。 在这一点上它就超越了关系型数据库的各种限制,并且CouchDB提供了一个可靠的,易扩展的且响应快速的开源解决方案。 CouchDB使用自包含的数据,它们拥有松散的或者特定的联系。这是一个适合于许多现实世界物品的模型,比如通讯录、发票和收据。 但你会发现这个数据库能够轻松的处理任何形式的数据。 通过《CouchDB权威指南》,你将学会如何通过CouchDB的RESTful Web接口来使用它,此外你还会熟悉CouchDB的一些主要特性,比如简单的文档的CRUD(创建、读取、更新、删除); 高级的MapReduce,部署优化等更多的内容。 * 理解面向文档存储和操作的基础知识。 * 通过HTTP,使用CouchDB的RESTful接口来与其进行交互。 * 以自包含的JSON文档的形式来建模数据。 * 自然的处理不断变化的数据模型。 * 使用MapReduce视图来查询和综合CouchDB中的数据。 * 在节点间进行复制。 * 优化CouchDB来适应不断提高的性能和可靠性要求。