数据库挖掘/数据仓库
-
IBM数据仓库及IBM商务智能工具(美)冈萨雷斯 著,吴刚 等译;吴刚译内容简介:本书主要介绍了商务智能和数据仓库的一系列问题,如数据体系结构、技术体系结构、OLAP、数据挖掘、空间分析,以及数据抽取、转换和装载(ETL);更集中关注的是如何利用IBM的一系列应用广泛的成熟技术解决这些问题,例如,SMP和MPP技术体系结构,DB2通用数据库,DB2OLAPServer数据管理技术,智能挖掘器,空间扩展器等。本书写作方向明确,主题清晰,兼顾了深度与广度,在彻底地剖析了商业智能之后,对使用IBM关于建立、维护和挖掘数据仓库领域中的丰富产品族提出了颇具实用性的建议。致谢我谨向GaryRobinson致以特别的感谢,感谢他所付出的劳动及对我们的指导和帮助。假如没有他的帮助,我们不可能找得到写这本书所必要的确认过的资料。对本书做出贡献的人NagrajAlur是坐落于圣何塞(SanJose)的IBM国际技术支持组织中的一位项目领导者。他有28年以上的关于数据库管理系统(DBMS)的经验。他曾经是一位程序员、系统分析师、项目领导者、咨询师和研究员。他的专业领域涵盖了数据库管理系统、数据仓库、分布式系统管理、数据库性能及客户-服务器和Internet计算。SteveBenner目前负责ESRI公司战略事务。过去13年,他在地理信息系统(GIS)行业从事过各种不同的工作,他曾经在TDWI教授过GIS和数据仓库方面的课程,并就GIS和SAP的集成为《SAP技术周刊》杂志撰文。RonFryer一直从事IBM数据管理工作。作为一个数据库建模和数据库管理人员,他在设计、组建决策支持环境上拥有20年以上的工作经验,这其中包括超过10年的数据仓库经历。他曾经为世界上最大的几个数据仓库工作过。Ron发表了大量的关于数据库设计及数据库管理系统结构的文章。他也是"UnderstandingDatabaseManagementSystems,SecondEdition"(RobMattison,McGraw-Hill,1998)一书的作者之一。JacquesLabrie从1984年起至今,曾经是IBM多个产品的研发团队的领导者和关键研发人员,他同时也是IBMDB2DataWarehouseCenter和数据仓库管理器的架构师。Jacques有超过15年的领导和管理数据管理产品的经历,其中包括ETL工具,如IBM的数据抽取产品;基于工作站的元数据管理工具,如IBM数据指南和信息分类管理器;数据仓库管理工具,如IBM可视化数据仓库和DB2DataWarehouseCenter。Jacques在位于圣何塞的加利福尼亚州立大学获得了数学学士学位。GregorMeyer从1997年起为IBM工作,他当时加入了位于德国的DB2智能挖掘器的开发团队。目前,他在IBM的位于圣何塞的硅谷实验室工作,主要负责数据挖掘集成和其他DB2商务智能技术的工作。Gregor曾经在德国的布伦瑞克和斯图加特学习计算机科学,他在德国的哈根大学获得了博士学位。WendellB.Mitchell目前是Focus集团公司资深的数据架构师。他在众多TDWI会议上提出数据挖掘、ETL、商务智能和OLAP等方面的实验指导。Wendell在密歇根州的西密歇根大学分别获得了数学和计算机科学的学士学位。RogerD.Roles目前是信息分类元数据管理应用的架构师。他是一位软件开发的老手,具有27年的开发经历:在Fortran语言环境下从事计算机辅助设计和应用开发,用C语言及汇编语言开发UNIX操作系统内核。自1993年起为IBM工作的这一段时间里,他在不同部门从事过微内核、文件系统和应用开发。在最近的6年中,作为一个团队领导者和核心开发人员,他从事在Java环境下开发商务智能应用的工作。RichardSawa自从1998年起一直在HyperionSolutions供职。他目前在俄亥俄州的哥伦比亚担任IBM数据管理部门的HyperionSolutions的技术开发经理。他是IBM红皮书"DB2OLAPServerTheoryandPractice"(2001年4月)的主要写作者,先前作为一个独立的顾问,Sawa拥有10年左右的相关决策支持和OLAP技术的经验。WilliamSterling从1992年起就一直从事OLAP工作,当时他在ArborSoftware(ESSBASE的诞生地)。他的专长是调节OLAP数据库,重点放在商业系统建模、量化分析和设计上。1999年,他加入IBM,成为IBM全球商务智能分析团队的一名技术人员。PhongTruong是IBMDB2DataWarehouseCenter和数据仓库管理器中主要的数据仓库服务器的开发人员,并且他也是Trillium、MQSeries及OLEDB集成项目组的领导者。他具有13年以上的广泛的研发经验及DB2UDB组件的客户服务经验。他在加拿大的阿尔伯达的卡尔加里大学获得了理科学士学位。PaulWilms已经在IBM从事了20年以上的分布式数据库和商务智能工作。他撰写及与别人合作撰写了几篇有关IBM的R*及Starburst研究项目的论文。在最近的10年中,他为IBM商务智能及ETL工具的客户提供技术支持及咨询工作。Paul在美国及海外的许多国际会议上做过讲座。他在法国格勒诺布尔的国家理工学院获得了计算机科学的博士学位。Cheung-YukWu目前是IBMDB2DataWarehouseCenter和数据仓库管理器的架构师。她有15年以上的相关数据库工具开发经验,包括运行于Windows或UNIX平台之上的DB2、Oracle、Sybase、MicrosoftSQLServer和Informix数据库。她也开发了一些产品,如为DB2开发Tivoli,为UNIX开发IBMDataHub和QMF。此外,她还是IBM圣何塞制造数据中心的DB2、CICS和IMS的数据库管理员。她于加利福尼亚州立理工大学获得计算机科学学士学位。ChiYeung是IBMDataWarehouseCenter和数据仓库管理器主要的GUI开发人员。目前,他是多个数据仓库GUI组件的团队领导者,这些GUI组件包括数据仓库源、进库/出库/发布、用户团体、代理机构,以及复制步骤。他有超过13年的在IBM产品上的可扩展GUI和面向对象程序设计和开发的经验,这些产品包括智能挖掘器、内容管理器、LotusApproach和QMF的集成及可视化工具等。他在康奈尔大学获得了理学学士学位,在斯坦福大学获得了理学硕士学位,在加州大学伯克利分校获得了商业管理硕士学位。CalistoZuzarte是IBMToronto实验室DB2QueryRewrite开发组的资深技术管理人员。他的特长在于主键的查询回写,以及那些影响数据库中的复杂查询性能的基于成本的优化组件。VijayBommireddipal是IBMDB2DataWarehouseCenter和数据仓库管理器开发团队的一名成员,一直从事数据仓库进库/出库的应用(包括tag及CWM格式)、数据仓库案例,以及数据仓库元数据交换的ISV工具包方面的工作。他于2000年7月加入IBM,那时他已获得位于达特茅斯的麻萨诸塞大学的电子和计算机工程的硕士学位。译者序21世纪是知识爆炸的时代,我们每个人在处理日常工作和学习事务时都面对着一种同样的过程:从采集知识、筛选知识、使用知识到存储和管理知识。在纷繁复杂的知识面前,我们一边感叹着弗朗西斯·培根的名言:Knowledgeispower(知识就是力量),一边却在知识的海洋中迷失了方向。《IBM数据仓库及IBM商务智能工具》正是一本能够引导我们在IBM的产品和技术中获取、使用和管理知识的上乘之作。本书比较系统地阐述了商务智能(BI)和数据仓库问题,以及如何通过IBM的技术来解决这些问题。它包含的内容只和数据仓库有关,涉及到IBM产品时,不具体介绍细节,比如不介绍SQL的语法,因为市面上各式各样的DB2SQL的书籍唾手可得。只有那些专门描述与商务智能或数据仓库相关的问题才会在本书中有所提及。不仅如此,本书也不具体展开其所研究技术的各个方面,比如,不讨论DB2V8的所有特征和功能,因为你可以发现成打的介绍数据库引擎的一般功能的书。此书将重点放在了阐述数据存储的架构、分析和数据管理方面。所以,读者在本书中看到的将是IBM产品中那些影响BI和数据仓库的技术。这使本书避免了一些无病呻吟的噪声。作者的目的就是为了让读者在阅读后可以收到立竿见影的效果。承担本书翻译工作的有南京理工大学的吴刚、王永明、郑立青、赵昱、鞠飞、罗力恒和苏州科技学院的董志国。限于译者水平,译文中定有许多不妥之处,敬请读者批评指正。对IBM数据仓库一书的赞评"这本书兼顾了深度与广度,它以一种超越平常的方式涵盖了商务智能领域。它不仅描述了各种不同的IBM产品,如IBMDB2、IBM智能挖掘器,以及IBMDB2OLAP,而且还全面地剖析了对数据挖掘体系结构、分析及数据管理。"WayneEckerson数据仓库研究所主任"如今,各个企业都面临着一种''''数据泛滥''''的境地,而这些数据是关于顾客、原料供应商、合作伙伴、雇员和竞争对手的。为了生存和发展下去,企业越来越需要信息管理的解决方案。MichaelGonzales的书对于IBM公司的商务智能软件介绍得非常好,而这些软件可以帮助企业更快、更好地做出决策。在全面地介绍了IBM数据仓库、OLAP、数据挖掘器和空间分析能力的同时,MichaelGonzales清楚地指出了在信息竞争日益激烈的时代中,在企业组织和数据的体系结构上取得成功所必不可少的支柱。"JeffJonesIBM数据管理方案的高级程序经理"IBM公司在提供完备和易用的数据仓库、数据分析和数据管理技术方面处于业界领先。这本书阐述了对于每本涉及数据仓库的书最为重要的专业要点 -
数据结构与算法黄国兴,章炯民编著“数据结构与算法”是计算机科学与技术专业的一门很重要的专业基础课,也是《中国计算机科学与技术学科教程2002》中指定的核心课程之一。本书内容覆盖了该教程中关于这门课程的所有知识点。在处理这些知识点时,本书充分考虑了数据结构和算法的融合。和传统教材相比,本教材在不增加教学学时的情况下,强化了对算法的训练,为学生学习后继课程打下扎实的基础。 本书适合计算机科学与技术学科和相关专业的本科生学习,也可作为自学教材。 -
Web数据库设计与应用实验邱钦伦,刘雍豪 编“Web数据库设计与应用”是中央广播电视大学软件开发与应用专业信息系统开发方向和网站应用编程方向的专业核心课程。该课程以最新的Web开发技术ASP.NET和数据库技术ADO.NET为核心,具有先进和非常实用的特点。《软件开发与应用专业系列教材:web数据库设计与应用实验》是与《Web数据库设计与应用》相配套的实验教材,全书分为8个实验。除主教材的第一章外,每章均配有对应实验。其中,第6章内容较多,分为5个练习。由于每个实验都配有相应的预备知识,而且实验内容也比较简单实用,并配备了大量插图,所以读者也可以将《软件开发与应用专业系列教材:web数据库设计与应用实验》独立使用,作为快速了解ASP.NET开发技术的参考资料。 -
数据挖掘在冶金产品质量控制中的应用邢进生 著本书是系统介绍数据控制在冶金产品质量控制方面的专著,内容包括冶金产品质量数据的挖掘过程框架、数据集市、人工神经网络的特征、人工神经网络质量模型、模糊神经网络质量模型、基于多种产品模型的新产品新工艺设计、基于模糊神经网络的产品质量控制软件及上述诸方面的应用实例。本书可供高等院校自动控制、计算机、过程控制、管理科学与工程等专业的研究生、教师以及从事生产过程控制和管理的科技人员阅读。 -
数据挖掘中的新方法邓乃扬,田英杰著支持向量机是数据挖掘中的一个新方法。支持向量机能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域,因此可应用于理科、工科和管理等多种学科。目前国际上支持向量机在理论研究和实际应用两方面都正处于飞速发展阶段。希望本书能促进它在我国的普及与提高。本书对象既包括关心理论的研究工作者,也包括关心应用的实际工作者。对于有关领域的具有高等数学知识的实际工作者,略去书中的某些理论部分,仍能对支持向量机的本质有一个概括的理解,从而用它解决自己的问题。《数据挖掘中的新方法:支持向量机》适合高等院校高年级学生、研究生、教师和相关科研人员及相关领域的实际工作者使用。 -
实用数据挖掘(意)Paolo Giudici著;袁方等译;袁方译本书对面向应用的数据挖掘方法进行了清晰的阐述,包括经典的多元统计方法、贝叶斯多元统计方法、基于机器学习的数据挖掘方法和基于计算的数据挖掘方法等。介绍了数据挖掘领域中许多最新的研究成果,如关联规则、序列规则、图示马尔可夫模型、基于存储的推理、信用风险和Web挖掘等。并详细介绍了选自实际工业项目的6个应用实例,强调了数据挖掘方法的实用性。本书主要面向计算机科学、信息管理、应用统计学和经济学等专业的高年级本科生和研究生。对实际从事海量数据分析和处理的技术人员也有很好的指导作用和参考价值。 -
数据备份与灾难恢复牛云等编著本书主要介绍了数据存储技术、数据备份与灾难恢复的相关知识与实用技术,讨论了数据备份与灾难恢复策略、解决方案,数据库系统与网络数据的备份与恢复,对市场上的一些较成熟的技术和解决方案进行了分析比较。本书的特色是实用性强,使读者能够利用书中的方法和步骤去解决实际应用中的常见问题。本书适用于大专院校信息安全专业的师生和从事数据备份与灾难恢复的专业技术人员。 -
数据模型资源手册(美)Len Silverston著;林友芳等译本书不仅讨论了数据体系的顶层结构,它还提供了通用的和行业专用的逻辑模型,也提供了一些数据设计,我们可以对这些设计进行定制以满足各自的需求。这样就能得到一个丰富的架构,其中的各种模型将包括一个数据体系结构的高层和低层部分,包括高层模型、逻辑模型、仓库设计、星型模式和SQL脚本。我们可以将这些数据模型、设计和脚本作为自己的模型设计工作的模板或者是起点,也可以将它们当成是我们不很熟悉的主题域的模型介绍,也可以将它们当成参考标准来对现有的模型进行校验,也可以利用它们来协助我们建立企业数据体系结构。本书给出了将这些模型从一个层次转换到另外一个层次的技术,本书也给出一些在模型中获得合适抽象层的技巧和技术。书中给出了一些实例表(样本数据),它们使得这些模型能更贴近现实。LenSilverston是UniversalDataModels公司的创立人和拥有者,该公司位于科罗拉多,提供咨询和培训,帮助企业定制和应用“通用数据模型”,开发全局和集成的系统。Silverston先生在提供数据集成、数据库和数据仓库解决方案方面已经具有20年的经验。本书第1版出版以来,业内专家门对该书进行了热烈的讨论,这不足为奇。本书将给您配备上一套功能强大的数据模型和数据仓库设计,采用这些模型可以将您的数据库设计项目带到一个高的起点上。您将获得通用业务功能的经过验证的模型,如订购和管理产品、处理装运、开票、财务和预算、管理人力资源、联系人管理和项目管理。本版经过完全校订和修改,包括了许多新的和扩展的数据模型,这些模型包括产品定制、装运和接收、预算背景和雇员资格和表现。另外,书中有新的数据集市设计,包括财务分析、库存管理和装运逻辑。本书适合作为数据建模人员的参考书。通过本书,您将学会:·如何定制企业和逻辑数据模型,以满足企业的具体需求·如何将逻辑数据模型转换成数据仓库和数据集市·如何开发物理数据设计和基于通用数据模型来评估设计选项·如何在企业范围内进行数据库和数据仓库集成·如何验证企业的现有数据模型 -
数据结构段隆振等编数据结构是计算机科学与技术专业重要的专业基础课程,是提高软件设计水平及学习后续课程必需的基础。课程中涉及到软件中常用的几种数结构及其在计算机内存中表示(或存储)和各种操作的实现,以及软件设计中常用的排序和查找运算。本书系统介绍了线性表、栈、队列、串、数组、广义表、树和二叉树、图、排序、查找和文件等。除了系统地介绍了关概念和一般方法外,还通过大量例题及其分析展示了课程知识的应用,因而容易激发学生的学习兴趣,具有较好的学习效果。本书不仅可以作为高等院校计算机科学与技术专业的数据结构课程的教材,也可作为其他专业学习数据结构课程的教材。 -
元数据仓储的构建与管理(美)David Marco著;张铭,李钦等译;张铭译这是探讨数据仓库工程中元数据问题的书,并且结果是激动人心的……DavidMarco以易懂、实用、立竿见影的方式阐述了该主题。对任何IT专业人士来说.本书都是一份极好的资料。”——SteveMurchie微软公司产品经理如果能得当地使用元数据仓储并且了解它们能做什么,不能做什么,就可以给公司提供巨大的价值。本书由元数据行业的权威撰写。书中提供了开发、部署和管理元数据仓储以便获得更大竞争优势所需的全部指导。本书不仅介绍基本概念,而且介绍如何利用元数据增加公司收入并削减开支。读者可以全面了解影响元数据产业的主要趋势以及构建一个足够灵活并能适应未来变化的元数据仓储的步骤。本书并不涉及具体产品,而是介绍元数据来源、标准和体系结构,并探讨有关实际实施问题的各个方面。本书逐步介绍实现元数据仓储的过程,告诉读者如何:●评估元数据工具●通过元数据来提高数据质量●制定元数据项目计划●创建物理元数据模型●设计定制的元数据体系结构●评估元数据交付需求本书附带的光盘包括:●一个实施项目计划样本●一份元数据工具需求的功能和特征清单●一些支持特定业务功能的物理元数据模型作者介绍DavidMarco是元数据行业的权威,并且是EnterpriseWarehousingSolutions公司的创始人和总裁,EnterpriseWarehousingSolutions公司是一家总部在芝加哥的战略合伙人和系统集成商。DavidMarco还是《DMReview》杂志的每月专栏作家,并且在世界范围内就数据仓库领域的技术进行过讲演。
