数据库挖掘/数据仓库
-
不确定图数据挖掘邹兆年 等著《不确定图数据挖掘》是国际上第一部系统阐述不确定图数据挖掘理论、技术和算法的学术专著。本书系统介绍了不确定图数据挖掘的数据模型、挖掘问题语义以及典型挖掘问题的计算复杂性和算法,具体包括期望语义下的频繁子图模式挖掘算法、概率语义下的频繁子图模式挖掘算法、极大团挖掘算法、紧密顶点子集挖掘算法、可靠子图挖掘算法和聚类算法。邹兆年等专著的《不确定图数据挖掘》适用于从事数据库与数据挖掘理论与技术研究的专业人员及相关高等院校师生阅读。
-
驾驭大数据(美)Bill Franks 著 黄海,车皓阳,王悦 等 译《驾驭大数据》为读者提供了处理大数据和在你的企业中培养一种创新和发现的文化所需的工具、过程和方法,描绘了一个易于实施的行动计划,以帮助你的企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。本书主要介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。《驾驭大数据》适于所有对数据、数据挖掘、数据分析感兴趣的技术人员和决策者阅读。
-
大话数据挖掘西安美林电子有限责任公司 编著《大话数据挖掘》以EMBA班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:第1章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。数据挖掘是一种专业性极强的技术,本书避开大量晦涩的概念和令人生畏的数学公式,以师生互动讨论的形式让读者走进数据挖掘殿堂,进而深入浅出、循序渐进地感知数据挖掘。随着阅读,读者会自然而然地身临课堂,“让数据说话,从数据中发现规律,科学决策”等新的理念会使读者对实际工作中面临的复杂问题浮想联翩、另辟新径。《大话数据挖掘》适合企事业部门的领导、管理人员、生产一线的技术人员,另外,学生或者行业工作者,可以通过本书的阅读,为以后的学习奠定好基础。
-
预测性文本挖掘基础(美) 绍洛姆·韦斯(Sholom M.Weiss) (澳)尼亭·因杜尔亚(Nitin Indurkhya)(美)张潼(Tong zhang),赵仲孟 侯, 迪 译电脑普及带来的一个结果是文档以数字形式呈现出来,加之Internet的广泛使用,这些文档就变得唾手可得。文本挖掘,即对非结构化的自然语言文本的分析过程,主要针对的是如何从这些文档中提取信息。《预测性文本挖掘基础》是一本入门级的教科书,是在修订施普林格已经成功出版的文本挖掘领域的参考书基础上得到的,旨在能够帮助读者了解这个快速发展的领域。同时,该书也整合了包括数据挖掘、机器学习、数据库以及计算语言学方面很多的理论,因此这本独一无二的书也提供了一些文本挖掘方面比较实用的建议。书中深层次地讨论了文档分类、信息检索、聚类和组织文档、信息提取、基于web的数据源的预测和评价问题。要学习《预测性文本挖掘基础》,如果读者有数据挖掘方面的知识自然很好,但这并不是必须的。书中有些地方涉及到一些高级概念,这些需要读者有一定的数学功底,当然我们也提供了一些直观上的解释来帮助那些非专业读者。
-
大数据李志刚 主编不管你愿意不愿意,我们每天都在制造和分享数据;不管你关心不关心,我们已经生活在大数据的包围之中。大数据,这个在2012年突然火爆起来的词汇,我们究竟该如何解读?本书介绍了大数据产生的背景、特征和发展趋势,从实证的角度探讨了它对社会和商业智能的影响,并认为大数据正影响着商业模式的转变,将带来新的商业机会。能否对大数据进行处理、分析与整合将成为提升企业核心竞争力的关键!大数据,既是一场大机遇,也将引发一场大变革!
-
土地资源评价数据挖掘方法与应用胡月明,张俊平 著《土地资源评价数据挖掘方法与应用》从土地资源评价数据库建立、评价指标体系确定及指标权值制定、样本容量的计算、土地质量等级评定入手,系统地研究了数据挖掘技术在土地资源评价各主要环节中的应用。全书详细地对土地资源评价方法进行了综述和展望,简明阐述了数据挖掘的概念和一般程序;介绍了因子分析、层次分析、模糊层次分析、灰色关联综合分析和BP神经网络方法,及其在指标权值制定中的应用;引进了抽样技术解决了样本容量的确定;应用K-均值聚类分析,二步聚类分析、模糊综合评判和模糊聚类分析等方法,实现了土地质量的无监督学习分类;采用Fisher判别分析、Logistic多元回归分析、决策树分析、BP神经网络模型、径向基概率神经网络模型和支持向量机等方法,对土地质量进行了有监督学习分类。
-
大数据(美) Anand Rajaraman (美) Jeffrey David Ullman 著,王 斌 译本书源自作者在斯坦福大学教授多年的“Web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前Web应用的许多重要话题。主要内容包括:□ 分布式文件系统以及Map-Reduce工具;□ 相似性搜索;□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;□ 搜索引擎技术,如谷歌的PageRank;□ 频繁项集挖掘;□ 大规模高维数据集的聚类算法;□ Web应用中的关键问题:广告管理和推荐系统。本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。
-
CouchDB权威指南(美)J.Chris Anderson,(美)Jan Lehnardt,(美) Noah Slater 著 来诺 译三位CouchDB的开发者向你展示了如何以独立应用框架的形式来使用这一面向文档的数据库,以及如何使用它来构建高容量、分布式的应用。 CouchDB简洁的存储,处理,以及读取数据的模型,让它成为了构建处理海量松散结构数据的Web应用的理想选择。 在这一点上它就超越了关系型数据库的各种限制,并且CouchDB提供了一个可靠的,易扩展的且响应快速的开源解决方案。 CouchDB使用自包含的数据,它们拥有松散的或者特定的联系。这是一个适合于许多现实世界物品的模型,比如通讯录、发票和收据。 但你会发现这个数据库能够轻松的处理任何形式的数据。 通过《CouchDB权威指南》,你将学会如何通过CouchDB的RESTful Web接口来使用它,此外你还会熟悉CouchDB的一些主要特性,比如简单的文档的CRUD(创建、读取、更新、删除); 高级的MapReduce,部署优化等更多的内容。 * 理解面向文档存储和操作的基础知识。 * 通过HTTP,使用CouchDB的RESTful接口来与其进行交互。 * 以自包含的JSON文档的形式来建模数据。 * 自然的处理不断变化的数据模型。 * 使用MapReduce视图来查询和综合CouchDB中的数据。 * 在节点间进行复制。 * 优化CouchDB来适应不断提高的性能和可靠性要求。
-
数据仓库与数据挖掘导论李於洪 主编《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。第一篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实验、决策树与关联分析实验,强化培养学生的应用能力。《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》可作为普通高等院校计算机专业、软件工程专业、信管专业等其他相关专业的教材,也可作为数据仓库与数据挖掘方面的培训教材,对于希望了解或学习数据仓库与数据挖掘知识的自学人士,本书具有较强的可读性。
-
数据挖掘(美)Jiawei Han 等 著 范明,孟小峰 译《数据挖掘:概念与技术(原书第3版)》完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。《数据挖掘:概念与技术(原书第3版)》是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。