数据库挖掘/数据仓库
-
计算机密码学卢开澄编著全书共13章,叙述了密码学基本概念、分组密码、公钥密码、大数运算、密码协议、密钥管理等,第3版比第2版增加了大数运算、数字签名、密钥管理、密码协议等内容。在电子商务和电子政务的兴起和发展过程中,近代密码学扮演了十分活跃的角色。本书是在第2版的基础上,结合这几年密码学技术的发展改写而成。全书共13章,叙述了密码学基本概念、分组密码、公钥密码、大数运算、密码协议、密钥管理等,第3版比第2版增加了大数运算、数字签名、密钥管理、密码协议等内容,尤其对AES的加密标准及部分候选算法做了详细的介绍,并加强了与网络通信的保密安全相关的内容。本书可作为计算机专业或其他专业关于“网络通信保密安全”相关课程的教材或参考书。
-
数据仓库与数据挖掘陈文伟,黄金才编著数据仓库(DW)与数据挖掘(DM)是20世纪90年代中期兴起的新技术。数据仓库用于决策分析,数据挖掘用于从数据库中发现知识。数据仓库和数据挖掘的结合为决策支持系统(DSS)开辟了新方向,它们也是商业智能(BI)的主要技术。本书主要介绍数据仓库系统、数据仓库的数据获取与管理、数据仓库的设计和开发、联机分析处理(OLAP)、数据挖掘与文本挖掘、决策树方法、粗糙集方法与关联规则挖掘、公式发现、神经网络与遗传算法、基于案例推理、决策支持系统与商业智能等内容。本书包含了作者多年来在数据仓库与数据挖掘中的研究成果。本书可作大学计算机专业、管理科学与工程专业、系统工程专业等高年级本科生与研究生课程的教材,也可以作有关学科科技人员的参考书。
-
数据仓库与数据挖掘周根贵主编《数据仓库与数据挖掘(第2版)》侧重于信息管理中信息组织与处理的技术,全面而系统地介绍了数据仓库与数据挖掘的基本概念、基本方法和基本技术,以及数据仓库与数据挖掘的应用领域与最新进展。全书共分10章,包括概论,数据仓库的技术与开发,数据仓库的管理,联机分析处理,SQLServer数据仓库的应用与开发,数据挖掘与知识发现,统计类数据挖掘技术,知识类数据挖掘技术,21世纪的数据挖掘技术,数据仓库与数据挖掘的综合应用等内容。为了便于学习,每一章都有提要和小结,并配有一定数量的习题,以帮助读者对基本内容的理解和掌握。《数据仓库与数据挖掘(第2版)》深入浅出,阐述清晰、理论与实际并重,可作为高等院校信息管理与信息系统等专业本科生、研究生的教材。
-
数据结构经典算法实现与习题解答汪杰等编著本书以计算机学科的主干课程——数据结构为主线索组织内容,涵盖了计算机学科涉及到的大部分经典算法的实现,书中结合大量的图示和程序代码,展示了各种数据结构的实现细节和编程技巧,能够帮助学习者提高运用知识解决实际问题的能力。同时,书中还汇编了高校数据结构常用教材中出现的大部分习题的解答。本书的配套光盘中附带了书内提到的所有经典应用的C语言实现。本书既可作为计算机及相关专业的学生学习数据结构、进行课程设计的辅导材料,又可作为学习者学习计算机学科其他相关课程的辅导材料。
-
统计学习基础(美)Trevor Hastie等著;范明等译;范明译随着计算机和信息时代的到来,统计问题的规模和复杂性都有了急剧增加。数据存储、组织和检索领域的挑战导致一个新领域“数据挖掘”的产生。数据挖掘是一个多学科交叉领域,涉及数据库技术、机器学习、统计学、神经网络、模式识别、知识库、信息提取、高性能计算等诸多领域,并在工业、商务、财经、通信、医疗卫生、生物工程、科学等众多行业得到了广泛的应用。本书试图将学习领域中许多重要的新思想汇集在一起,并且在统计学的框架下解释它们。尽管有些数学细节是必要的,但本书强调的是方法和它们的概念基础,而不是理论性质。本书内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的,适合从事数据挖掘和机器学习研究的读者阅读。TrevorHastie,RobertTibshirani和JeromeFriedman都是斯坦福大学统计学教授,并在这个领域做出了杰出的贡献。Hastie和Tibshirani提出了广义和加法模型,并出版专著“GeneralizedAdditiveModels”。Hastie的主要研究领域为:非参数回归和分类、统计计算以及生物信息学、医学和工业的特殊数据挖掘问题。他提出主曲线和主曲面的概念,并用S-PLUS编写了大量统计建模软件。Tibshirani的主要研究领域为:应用统计学、生物统计学和机器学习。他提出了套索的概念,还是“AnIntroductiontotheBootstrap”一书的作者之一。Friedman是CART、MARS和投影寻踪等数据挖掘工具的发明人之一。他不仅是位统计学家,而且是物理学家和计算机科学家,先后在物理学、计算机科学和统计学的一流杂志上表发论文80余篇。计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语来表达。本书介绍了这些领域的一些重要概念。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。本书内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的。本书可作为高等院校相关专业本科生和研究生的教材,对于统计学相关人员、科学界和业界关注数据挖掘的人,本书值得一读。
-
疑难数据仓库专家解决方案(美)Sid Adelman等著;冯宏等译;冯宏译本书的第1篇讨论管理方面的难以应付的情况,第2篇研究技术方面的难以应付的情况。这两篇中的讨论顺序大体上就是开发一个项目遇到这些情况的顺序,但是每一章都独立于它前面的各章节。读者可以从头至尾地阅读本书,但不必拘泥于这种阅读方式;读者也可以直接跳到讨论了给你造成最大麻烦的那些问题的章节。例如,如果读者目前正受困于数据质量问题,那么讨论数据质量的第11章可能就是你开始阅读的好地方。各章的每一节都介绍一个与本章主题相关的难以应付的情况,接着给出每位专家所建议的解决方案(按专家姓氏的字母顺序介绍)。SidAdelman是SidAdelman&Associates的创始人,这是一个专门从事规划与实现数据创库的组织。他经常出席数据仓库会议,并指导一个数据仓库的组织。他经常出席数据仓库会议,并指导一个数据仓库项目管理的研究组。Sid还是BIAIIiance的一名创办成员。他参与开发了一种为实现数据仓库提供一份主要计划的方法学。他曾和LarissaMoss合著了《数据仓库项目管理》一书。本书主要介绍正常运作的数据仓库对组织的成功是至关重要的,但建设和维护任一数据仓库都会充满难以预料的危险或困难。本书介绍了各种类型、规模和结构的公司都会面临的91种常见疑难及其解决方案。9位数据仓库建设方面的权威专家对这些看似难以应付的危机各抒己见,并给?笠倒芾砣嗽薄T经理与职员以及终端用户提供了防止和拯救这些危机的具体措施。本书的第一篇解决难以应付的各种管理问题,其中包括薄弱的组织支持、不切实际的进度安排和职员配备问题。第二篇重点关注各种技术挑战,比如安全、集成和性能。本书通过实际的示例,从多种角度提供了实用的解决方案。另外,还为希望进一步阅读的读者推荐了大量资源,并在书后提供了覆盖专业词汇与同义词的词汇表及口语词汇表。
-
数据仓库生命周期工具箱(美)Ralph Kimball[等]著;肖明[等]译;肖明译《数据仓库生命周期工具箱》刚一问世,好评如潮。在Barnesandnoble.com公司网站上,有读者评价说:“尽管我在项目管理和数据建模方面积累了多年的初中经验,但我认为本书才是解决有关项目管理和数据仓库生命周期方面问题的最好参考信息源。”还有读者认为“本书要比第一版更加物有所值,它探讨了有关数据仓库的设计、实现、运行、维护和管理等方面的几乎所有问题。”本书深入探讨了两个主题,一个是业务维生命周期方法。另一个是数据仓库总线结构。本书的主要读者对象应该是那些从事数据仓库的创建和管理工作的设计人员或者管理人员。本书略微偏向技术。RalphKimball,不仅是自1982年以来数据仓库界最伟大的幻想家,而且是目前在数据仓库方面国际知名度最高的演讲家,项目顾问以及教师之一。他曾经为《智能化企业》杂志负责撰写“数据仓库结构”专栏。KalphKimball博士的几位合作者们也都各自创建了获得了极大成功的数据仓库咨询公司,包括:LauraReeves的StarSoft解决方案公司、MargyRoss的DecisionWorks咨?疽约癢arrenThornthwaite的InfoDynamicsLLC公司。本书是著名数据仓库畅销书作者RalphKimball的著名作品,在世界各地畅销不衰。这是目前惟一一本从技术和管理两个角度介绍了使数据仓库项目获得成功所必备的各种知识和经验教训的专著,这些内容都是作者自1982年以来在从事数以百计的数据仓库安装和咨询任务过程中不断积累总结出来的。书末的两个附录中提供了大量的框架、任务、模板以及生动详实的样例(具体内容见本书配套光盘),所有这些都使本书别具一格。全书主题广泛,思想深刻,内容详尽,图文并茂。本书不仅是现代信息系统开发人员的重要指南,而且是所有面向数据仓库项目的设计、开发、管理和咨询人员的高级参谋,并且适合信息管理与信息系统、计算机应用、电子商务等专业的高校师生作为教学参考用书,还可供从事传统数据库系统工作的技术人员参考阅读。
-
数据挖掘(美)迈克尔·J.A.贝里(Michael J.A.Berry),(美)戈登·S.利诺夫(Gordon S.Linoff)著;袁卫[等]译;袁卫译数据挖掘是信息领域发展最快的技术,很多不同领域的专家,比如统计学家、数据库专家等,都从中获得了发展的空间,使得数据挖掘日益成为企业界讨论的热门话题。随着信息技术的发展,人们采集数据的手段日益丰富与高明,由此积累的数据日益膨胀,数据量达到GB甚至TB级,而且高维数据也日益成为主流。这些海量数据及其高维特征使得传统的数据分析手段相形见绌。计算机性能的日益更新,使得人们能够期望计算机帮助我们分析与理解数据,帮助我们以丰富的数据为基础做出正确决策。《数据挖掘::客户关系管理的科学与艺术》一书将对数据挖掘作全面的介绍。第一部分从商业领域开始。本部分的四章将回答如下的问题:数据挖掘为什么重要?数据挖掘有哪些诀窍?第四章将特别介绍客户及客户关系管理。尽管数据挖掘在许多领域都有成功的应用,但在客户关系管理领域引起了人们格外的兴趣和重视。第二部分从技术层面上介绍数据挖掘。第五章回顾数据挖掘技术(这些技术和方法在我们的第一本书里有详细的介绍),第六章讨论数据,接下来的第七章研究如何建立好模型。这一章十分重要,因为它包含了我们多年的经验和教训。第三部分是本书最长的部分,也是最重要的部分。这部分是数据挖掘的案例研究。尽管这些案例都是商业领域的,但涉及的范围还是很广的,从对数十万兆字节数据的探索(hundreds。fgis9-bytes。fdata)到为网络银行客户服务预报下一个标题广告,从而改进印刷过程。所有这些案例讨论的都是实际的问题,同时都给出了其中所用的方法、数据、所得到的结果以及经验和教训。最后一章是以更广阔的视野来观察数据挖掘,即从社会的角度。数据挖掘一方面要反对专制,提倡数据公开,同时要重视保护个人的隐私。迈克尔和我试图充分展示数据挖掘的功能,但在分析数据时要特别小心,以保护个人隐私。在编写这本书时,我们特别强调数据挖掘的实际应用。我们希望这本书能够帮助读者掌握这门艺术。作者简介:迈克尔·贝里和戈登·利诺夫是数据挖掘公司的创始人,这是美国一家很受欢迎的数据挖掘顾问公司。在从事数据挖掘项目之余,他们在世界各地讲课、演讲,所到之处均大受欢迎。公司站点:www.data-miners.com,该站点内容包括:最新的数据挖掘产品和服务提供商的信息、数据挖掘会议、课程和其他信息、本书中用到的图片的彩色版本。目录:第1部分本书焦点第1章数据挖掘概述第2章为什么要精通数据挖掘这门艺术第3章数据挖掘方法论:互动循环系统第4章客户和他们的生命周期第2部分数据挖掘的三大支柱第5章数据挖掘技术与算法第6章无所不在的数据第7章建立有效的预测模型第8章实施控制:建立数据挖掘环境第3部分案例研究第9章数据挖掘在目录直销业中的应用第10章数据挖掘在在线银行业中的应用第11章数据挖掘在无线通信业中的应用第12章数据挖掘在电信业中的应用第13章谁正在买什么?第14章不浪费、不短缺:改善生产流程第15章社会议题:数据挖掘与隐私权索引
-
点击流数据仓库(美)斯韦格特等 著,陆昌辉等 译;陆昌辉译本书解释了构建点击流数据仓库所需要的Web技术和IT基础设施,并对设计、实现点击流数据仓库的整个过程提供全面的指导,包括:计划、人员分工以及管理整个工程;使用创新的元模式设计模板设计点击流数据仓库;挑选合适的数据仓库软件和存储子系统以支撑点击流数据仓库;建立抽取、变形和装载(即ETL)机制,以及将数据传送给分析这些数据的终端用户。本书主要面向学习或在工作中运用点击流数据仓库技术的教师、学生或工程技术人员,特别适合对数据仓库技术有所了解,但希望进一步提高构建点击流数据仓库能力的应用开发人员。
-
基于数据仓库的数据挖掘技术康晓东主编《基于数据仓库的数据挖掘技术》从数据库、数据库管理系统与数据仓库比较开始,介绍了数据仓库原理、数据仓库设计、联机分析处理、数据挖掘算法、统计类数据挖掘和知识类数据挖掘、其他数据挖掘技术和工具及数据仓库的应用和管理,辅以大量具有启发怀的解决方案,从应用的角度分析了数据仓库的建设过程和联机分析、数据挖掘技术的选择。新技术产生、发展和不断完善的推动力,来自于现实生活需要。在人们发出“网络到底是存储信息的金矿还是埋葬信息的沼泽地”的困惑时,基于数据仓库的数据挖掘技术无颖为人们带来了新的希望。《基于数据仓库的数据挖掘技术》除可作为高等院校相关专业高年级本科生或研究生教材外,也可供各企、事业单位从事信息系统开发的工程技术人员参考。