数据库挖掘/数据仓库
-
元数据仓储的构建与管理(美)David Marco著;张铭,李钦等译;张铭译这是探讨数据仓库工程中元数据问题的书,并且结果是激动人心的……DavidMarco以易懂、实用、立竿见影的方式阐述了该主题。对任何IT专业人士来说.本书都是一份极好的资料。”——SteveMurchie微软公司产品经理如果能得当地使用元数据仓储并且了解它们能做什么,不能做什么,就可以给公司提供巨大的价值。本书由元数据行业的权威撰写。书中提供了开发、部署和管理元数据仓储以便获得更大竞争优势所需的全部指导。本书不仅介绍基本概念,而且介绍如何利用元数据增加公司收入并削减开支。读者可以全面了解影响元数据产业的主要趋势以及构建一个足够灵活并能适应未来变化的元数据仓储的步骤。本书并不涉及具体产品,而是介绍元数据来源、标准和体系结构,并探讨有关实际实施问题的各个方面。本书逐步介绍实现元数据仓储的过程,告诉读者如何:●评估元数据工具●通过元数据来提高数据质量●制定元数据项目计划●创建物理元数据模型●设计定制的元数据体系结构●评估元数据交付需求本书附带的光盘包括:●一个实施项目计划样本●一份元数据工具需求的功能和特征清单●一些支持特定业务功能的物理元数据模型作者介绍DavidMarco是元数据行业的权威,并且是EnterpriseWarehousingSolutions公司的创始人和总裁,EnterpriseWarehousingSolutions公司是一家总部在芝加哥的战略合伙人和系统集成商。DavidMarco还是《DMReview》杂志的每月专栏作家,并且在世界范围内就数据仓库领域的技术进行过讲演。
-
多维数据分析原理与应用姚家奕等编著数据仓库技术的研究和应用是当前数据管理领域的热点。随着信息化建设在企业、国家政府部门以及社会其他领域的不断普及,数据分析和决策支持系统的开发与建设逐渐纳入到信息化建设的过程中来。面向组织决策层的数据管理技术是决策者挖掘组织内部和组织外部经营管理信息价值的有利工具和方法。本书从数据仓库理论、多维数据分析技术和多维数据分析应用3个方面,以某市地税局数据仓库的成功实施为背景案例,系统地介绍了基于Microsoft SQL Server 2000的OLAP多维数据引擎——Analysis Services构建数据仓库多维数据集的全过程,旨在为读者提供从理论到应用的一整套数据仓库OLAP解决方案的清晰视图。本书可以作为信息管理专业和计算机专业本科生或硕士生教材,也可以作为从事数据仓库建设和研究人员的参考书。
-
实用数据挖掘(意)Paolo Giudici著;袁方等译;袁方译本书对面向应用的数据挖掘方法进行了清晰的阐述,包括经典的多元统计方法、贝叶斯多元统计方法、基于机器学习的数据挖掘方法和基于计算的数据挖掘方法等。介绍了数据挖掘领域中许多最新的研究成果,如关联规则、序列规则、图示马尔可夫模型、基于存储的推理、信用风险和Web挖掘等。并详细介绍了选自实际工业项目的6个应用实例,强调了数据挖掘方法的实用性。本书主要面向计算机科学、信息管理、应用统计学和经济学等专业的高年级本科生和研究生。对实际从事海量数据分析和处理的技术人员也有很好的指导作用和参考价值。
-
数据挖掘在冶金产品质量控制中的应用邢进生 著本书是系统介绍数据控制在冶金产品质量控制方面的专著,内容包括冶金产品质量数据的挖掘过程框架、数据集市、人工神经网络的特征、人工神经网络质量模型、模糊神经网络质量模型、基于多种产品模型的新产品新工艺设计、基于模糊神经网络的产品质量控制软件及上述诸方面的应用实例。本书可供高等院校自动控制、计算机、过程控制、管理科学与工程等专业的研究生、教师以及从事生产过程控制和管理的科技人员阅读。
-
Web数据库设计与应用实验邱钦伦,刘雍豪 编“Web数据库设计与应用”是中央广播电视大学软件开发与应用专业信息系统开发方向和网站应用编程方向的专业核心课程。该课程以最新的Web开发技术ASP.NET和数据库技术ADO.NET为核心,具有先进和非常实用的特点。《软件开发与应用专业系列教材:web数据库设计与应用实验》是与《Web数据库设计与应用》相配套的实验教材,全书分为8个实验。除主教材的第一章外,每章均配有对应实验。其中,第6章内容较多,分为5个练习。由于每个实验都配有相应的预备知识,而且实验内容也比较简单实用,并配备了大量插图,所以读者也可以将《软件开发与应用专业系列教材:web数据库设计与应用实验》独立使用,作为快速了解ASP.NET开发技术的参考资料。
-
数据挖掘中的新方法邓乃扬,田英杰著支持向量机是数据挖掘中的一个新方法。支持向量机能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域,因此可应用于理科、工科和管理等多种学科。目前国际上支持向量机在理论研究和实际应用两方面都正处于飞速发展阶段。希望本书能促进它在我国的普及与提高。本书对象既包括关心理论的研究工作者,也包括关心应用的实际工作者。对于有关领域的具有高等数学知识的实际工作者,略去书中的某些理论部分,仍能对支持向量机的本质有一个概括的理解,从而用它解决自己的问题。《数据挖掘中的新方法:支持向量机》适合高等院校高年级学生、研究生、教师和相关科研人员及相关领域的实际工作者使用。
-
数据备份与灾难恢复牛云等编著本书主要介绍了数据存储技术、数据备份与灾难恢复的相关知识与实用技术,讨论了数据备份与灾难恢复策略、解决方案,数据库系统与网络数据的备份与恢复,对市场上的一些较成熟的技术和解决方案进行了分析比较。本书的特色是实用性强,使读者能够利用书中的方法和步骤去解决实际应用中的常见问题。本书适用于大专院校信息安全专业的师生和从事数据备份与灾难恢复的专业技术人员。
-
数据模型资源手册(美)Len Silverston著;林友芳等译本书不仅讨论了数据体系的顶层结构,它还提供了通用的和行业专用的逻辑模型,也提供了一些数据设计,我们可以对这些设计进行定制以满足各自的需求。这样就能得到一个丰富的架构,其中的各种模型将包括一个数据体系结构的高层和低层部分,包括高层模型、逻辑模型、仓库设计、星型模式和SQL脚本。我们可以将这些数据模型、设计和脚本作为自己的模型设计工作的模板或者是起点,也可以将它们当成是我们不很熟悉的主题域的模型介绍,也可以将它们当成参考标准来对现有的模型进行校验,也可以利用它们来协助我们建立企业数据体系结构。本书给出了将这些模型从一个层次转换到另外一个层次的技术,本书也给出一些在模型中获得合适抽象层的技巧和技术。书中给出了一些实例表(样本数据),它们使得这些模型能更贴近现实。LenSilverston是UniversalDataModels公司的创立人和拥有者,该公司位于科罗拉多,提供咨询和培训,帮助企业定制和应用“通用数据模型”,开发全局和集成的系统。Silverston先生在提供数据集成、数据库和数据仓库解决方案方面已经具有20年的经验。本书第1版出版以来,业内专家门对该书进行了热烈的讨论,这不足为奇。本书将给您配备上一套功能强大的数据模型和数据仓库设计,采用这些模型可以将您的数据库设计项目带到一个高的起点上。您将获得通用业务功能的经过验证的模型,如订购和管理产品、处理装运、开票、财务和预算、管理人力资源、联系人管理和项目管理。本版经过完全校订和修改,包括了许多新的和扩展的数据模型,这些模型包括产品定制、装运和接收、预算背景和雇员资格和表现。另外,书中有新的数据集市设计,包括财务分析、库存管理和装运逻辑。本书适合作为数据建模人员的参考书。通过本书,您将学会:·如何定制企业和逻辑数据模型,以满足企业的具体需求·如何将逻辑数据模型转换成数据仓库和数据集市·如何开发物理数据设计和基于通用数据模型来评估设计选项·如何在企业范围内进行数据库和数据仓库集成·如何验证企业的现有数据模型
-
IBM数据仓库及IBM商务智能工具(美)冈萨雷斯 著,吴刚 等译;吴刚译内容简介:本书主要介绍了商务智能和数据仓库的一系列问题,如数据体系结构、技术体系结构、OLAP、数据挖掘、空间分析,以及数据抽取、转换和装载(ETL);更集中关注的是如何利用IBM的一系列应用广泛的成熟技术解决这些问题,例如,SMP和MPP技术体系结构,DB2通用数据库,DB2OLAPServer数据管理技术,智能挖掘器,空间扩展器等。本书写作方向明确,主题清晰,兼顾了深度与广度,在彻底地剖析了商业智能之后,对使用IBM关于建立、维护和挖掘数据仓库领域中的丰富产品族提出了颇具实用性的建议。致谢我谨向GaryRobinson致以特别的感谢,感谢他所付出的劳动及对我们的指导和帮助。假如没有他的帮助,我们不可能找得到写这本书所必要的确认过的资料。对本书做出贡献的人NagrajAlur是坐落于圣何塞(SanJose)的IBM国际技术支持组织中的一位项目领导者。他有28年以上的关于数据库管理系统(DBMS)的经验。他曾经是一位程序员、系统分析师、项目领导者、咨询师和研究员。他的专业领域涵盖了数据库管理系统、数据仓库、分布式系统管理、数据库性能及客户-服务器和Internet计算。SteveBenner目前负责ESRI公司战略事务。过去13年,他在地理信息系统(GIS)行业从事过各种不同的工作,他曾经在TDWI教授过GIS和数据仓库方面的课程,并就GIS和SAP的集成为《SAP技术周刊》杂志撰文。RonFryer一直从事IBM数据管理工作。作为一个数据库建模和数据库管理人员,他在设计、组建决策支持环境上拥有20年以上的工作经验,这其中包括超过10年的数据仓库经历。他曾经为世界上最大的几个数据仓库工作过。Ron发表了大量的关于数据库设计及数据库管理系统结构的文章。他也是"UnderstandingDatabaseManagementSystems,SecondEdition"(RobMattison,McGraw-Hill,1998)一书的作者之一。JacquesLabrie从1984年起至今,曾经是IBM多个产品的研发团队的领导者和关键研发人员,他同时也是IBMDB2DataWarehouseCenter和数据仓库管理器的架构师。Jacques有超过15年的领导和管理数据管理产品的经历,其中包括ETL工具,如IBM的数据抽取产品;基于工作站的元数据管理工具,如IBM数据指南和信息分类管理器;数据仓库管理工具,如IBM可视化数据仓库和DB2DataWarehouseCenter。Jacques在位于圣何塞的加利福尼亚州立大学获得了数学学士学位。GregorMeyer从1997年起为IBM工作,他当时加入了位于德国的DB2智能挖掘器的开发团队。目前,他在IBM的位于圣何塞的硅谷实验室工作,主要负责数据挖掘集成和其他DB2商务智能技术的工作。Gregor曾经在德国的布伦瑞克和斯图加特学习计算机科学,他在德国的哈根大学获得了博士学位。WendellB.Mitchell目前是Focus集团公司资深的数据架构师。他在众多TDWI会议上提出数据挖掘、ETL、商务智能和OLAP等方面的实验指导。Wendell在密歇根州的西密歇根大学分别获得了数学和计算机科学的学士学位。RogerD.Roles目前是信息分类元数据管理应用的架构师。他是一位软件开发的老手,具有27年的开发经历:在Fortran语言环境下从事计算机辅助设计和应用开发,用C语言及汇编语言开发UNIX操作系统内核。自1993年起为IBM工作的这一段时间里,他在不同部门从事过微内核、文件系统和应用开发。在最近的6年中,作为一个团队领导者和核心开发人员,他从事在Java环境下开发商务智能应用的工作。RichardSawa自从1998年起一直在HyperionSolutions供职。他目前在俄亥俄州的哥伦比亚担任IBM数据管理部门的HyperionSolutions的技术开发经理。他是IBM红皮书"DB2OLAPServerTheoryandPractice"(2001年4月)的主要写作者,先前作为一个独立的顾问,Sawa拥有10年左右的相关决策支持和OLAP技术的经验。WilliamSterling从1992年起就一直从事OLAP工作,当时他在ArborSoftware(ESSBASE的诞生地)。他的专长是调节OLAP数据库,重点放在商业系统建模、量化分析和设计上。1999年,他加入IBM,成为IBM全球商务智能分析团队的一名技术人员。PhongTruong是IBMDB2DataWarehouseCenter和数据仓库管理器中主要的数据仓库服务器的开发人员,并且他也是Trillium、MQSeries及OLEDB集成项目组的领导者。他具有13年以上的广泛的研发经验及DB2UDB组件的客户服务经验。他在加拿大的阿尔伯达的卡尔加里大学获得了理科学士学位。PaulWilms已经在IBM从事了20年以上的分布式数据库和商务智能工作。他撰写及与别人合作撰写了几篇有关IBM的R*及Starburst研究项目的论文。在最近的10年中,他为IBM商务智能及ETL工具的客户提供技术支持及咨询工作。Paul在美国及海外的许多国际会议上做过讲座。他在法国格勒诺布尔的国家理工学院获得了计算机科学的博士学位。Cheung-YukWu目前是IBMDB2DataWarehouseCenter和数据仓库管理器的架构师。她有15年以上的相关数据库工具开发经验,包括运行于Windows或UNIX平台之上的DB2、Oracle、Sybase、MicrosoftSQLServer和Informix数据库。她也开发了一些产品,如为DB2开发Tivoli,为UNIX开发IBMDataHub和QMF。此外,她还是IBM圣何塞制造数据中心的DB2、CICS和IMS的数据库管理员。她于加利福尼亚州立理工大学获得计算机科学学士学位。ChiYeung是IBMDataWarehouseCenter和数据仓库管理器主要的GUI开发人员。目前,他是多个数据仓库GUI组件的团队领导者,这些GUI组件包括数据仓库源、进库/出库/发布、用户团体、代理机构,以及复制步骤。他有超过13年的在IBM产品上的可扩展GUI和面向对象程序设计和开发的经验,这些产品包括智能挖掘器、内容管理器、LotusApproach和QMF的集成及可视化工具等。他在康奈尔大学获得了理学学士学位,在斯坦福大学获得了理学硕士学位,在加州大学伯克利分校获得了商业管理硕士学位。CalistoZuzarte是IBMToronto实验室DB2QueryRewrite开发组的资深技术管理人员。他的特长在于主键的查询回写,以及那些影响数据库中的复杂查询性能的基于成本的优化组件。VijayBommireddipal是IBMDB2DataWarehouseCenter和数据仓库管理器开发团队的一名成员,一直从事数据仓库进库/出库的应用(包括tag及CWM格式)、数据仓库案例,以及数据仓库元数据交换的ISV工具包方面的工作。他于2000年7月加入IBM,那时他已获得位于达特茅斯的麻萨诸塞大学的电子和计算机工程的硕士学位。译者序21世纪是知识爆炸的时代,我们每个人在处理日常工作和学习事务时都面对着一种同样的过程:从采集知识、筛选知识、使用知识到存储和管理知识。在纷繁复杂的知识面前,我们一边感叹着弗朗西斯·培根的名言:Knowledgeispower(知识就是力量),一边却在知识的海洋中迷失了方向。《IBM数据仓库及IBM商务智能工具》正是一本能够引导我们在IBM的产品和技术中获取、使用和管理知识的上乘之作。本书比较系统地阐述了商务智能(BI)和数据仓库问题,以及如何通过IBM的技术来解决这些问题。它包含的内容只和数据仓库有关,涉及到IBM产品时,不具体介绍细节,比如不介绍SQL的语法,因为市面上各式各样的DB2SQL的书籍唾手可得。只有那些专门描述与商务智能或数据仓库相关的问题才会在本书中有所提及。不仅如此,本书也不具体展开其所研究技术的各个方面,比如,不讨论DB2V8的所有特征和功能,因为你可以发现成打的介绍数据库引擎的一般功能的书。此书将重点放在了阐述数据存储的架构、分析和数据管理方面。所以,读者在本书中看到的将是IBM产品中那些影响BI和数据仓库的技术。这使本书避免了一些无病呻吟的噪声。作者的目的就是为了让读者在阅读后可以收到立竿见影的效果。承担本书翻译工作的有南京理工大学的吴刚、王永明、郑立青、赵昱、鞠飞、罗力恒和苏州科技学院的董志国。限于译者水平,译文中定有许多不妥之处,敬请读者批评指正。对IBM数据仓库一书的赞评"这本书兼顾了深度与广度,它以一种超越平常的方式涵盖了商务智能领域。它不仅描述了各种不同的IBM产品,如IBMDB2、IBM智能挖掘器,以及IBMDB2OLAP,而且还全面地剖析了对数据挖掘体系结构、分析及数据管理。"WayneEckerson数据仓库研究所主任"如今,各个企业都面临着一种''''数据泛滥''''的境地,而这些数据是关于顾客、原料供应商、合作伙伴、雇员和竞争对手的。为了生存和发展下去,企业越来越需要信息管理的解决方案。MichaelGonzales的书对于IBM公司的商务智能软件介绍得非常好,而这些软件可以帮助企业更快、更好地做出决策。在全面地介绍了IBM数据仓库、OLAP、数据挖掘器和空间分析能力的同时,MichaelGonzales清楚地指出了在信息竞争日益激烈的时代中,在企业组织和数据的体系结构上取得成功所必不可少的支柱。"JeffJonesIBM数据管理方案的高级程序经理"IBM公司在提供完备和易用的数据仓库、数据分析和数据管理技术方面处于业界领先。这本书阐述了对于每本涉及数据仓库的书最为重要的专业要点
-
支持CRM的数据仓库设计(美)Chris Todman著;钟鸣 等译本书主要介绍客户关系管理(CRM)环境中使用的数据仓库的设计和构建。书中介绍了数据仓库的概念,探讨了数据仓库的体系结构、逻辑模型、物理实现、工程管理等内容。并且描述了建造数据仓库的一些工具产品,介绍了购买这些工具时需要注意的问题。另外,书中还对数据仓库的时间性问题提出了独到的见解,给出了可行的方案。本书适合于希望学习数据仓库原理的人员以及数据仓库建造的顾问人员使用。译者序本书主要介绍客户关系管理(CRM)环境中使用的数据仓库的设计和构建。数据仓库是一种特殊的数据库,近几年来在信息技术行业中获得了极大的关注。根据著名的数据仓库专家W,H.Inmon在《BuildingtheDataWarehouse》一书中的定义:数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集戒的(Integrated)、非易失的(Non-Volatile)、时变的(TimeVariant)数据集合,用于支持管理决策。对于数据仓库的概念可以从两个层次予以理解,首先,数据仓库用于支持决策型、面向分析型的数据处理,它不同于企业现有的运营型(Operational)数据库;其次,数据仓库是对多个异构的数据源的有效集成,集成后按照主题进行了重新组织,并包含历史数据。而且对存放在数据仓库中的数据一般不再进行修改。从上述定义可知,数据仓库具有以下四大特点:1)面向主题。运营型数据库的数据面向事务进行组织,各个业务系统之间相互分离,而数据仓库中的数据按照一定的主题域进行组织。主题是一个抽象的概念,是指用户利用数据仓库进行决策时所关心的重点方面,一个主题通常与多个运营型信息系统相关。2)集成的。面向事务处理的运营型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有的分散的数据库数据提取、过滤的基础上经过系统加工、汇总和整理得到的,从而消除了源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。3)非易失的。运营型数据库中的数据通常实时更新,会根据需要及时发生变化。数据仓库中的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将长期保留,也就是说,数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的装载、刷新即可。4)时变的。也就是反映历史变化。运营型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时刻(如开始应用数据仓库的时刻)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础的。数据仓库不是静态的概念,只有把信息及时提交给需要这些信息的使用者,供他们做出改善业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重新组织,并及时提供给相应的管理决策人员,是设计和构建数据仓库的根本任务。因此,从业界的角度来看,构建数据仓库是一个工程,是一个过程。数据仓库中存放的数据不是最新的、专有的,而是来源于其他数据库。设计和构建数据仓库不是要取代原有的数据库,而是在一个较全面、完善的信息应用的基础上重新设计和构建,用于支持高层决策分析。数据仓库是数据库技术的一种新的应用,与其他数据库应用不同的是,数据仓库更像一种过程,一种对分布在企业内部各处的业务数据进行整合、加工和分析的过程。因此,数据仓库是一种概念,不是一种可以购买的产品。数据仓库中包括了一些重要的技术,如数据挖掘,即从大量的数据中提取出潜在的、鲜为人知的有用信息、模式和趋势。其目的是:提高市场决策能力;检测异常模式;在过去的经验基础上预测未来趋势。还包括事先构造汇总表,以提高信息的检索效率,同时不增加使用人员的负担,由程序在检索时自动进行表的转换等技术。本书介绍数据仓库的概念,探讨数据仓库的体系结构、逻辑模型、物理实现、工程管理等内容。并且对构建数据仓库的一些工具产品作了讨论,介绍了购买这些工具时需要注意的问题。书中还对数据仓库的时间性问题提出了独到的见解,给出了可行的解决方案。本书适合于希望学习数据仓库原理的人员以及数据仓库构建的顾问人员使用。参加本书翻译的主要成员有:钟鸣、常征。全书由刘晓霞同志审校。同时担任部分翻译及校对工作的还有郝玉洁、梅刚、石永平、王君、“张文、田晓涛、耿娜、何江华、孙登峰、樊伟、赵彦萍等。由于译者水平有限,书中难免有错误或不当之处,敬请读者批评指正。前言本书主要围绕数据仓库展开讨论。数据仓库是一种特殊的数据库,近几年来在信息技术行业中获得了极大的关注。关于数据仓库构造的书籍很多,但把重点放在数据仓库设计上的很少,但也不是没有,本书中将会引用它们。构造数据仓库的目的是使信息可用。没有人会怀疑信息的价值,我们认为,大多数组织机构都可能具有一个信息的“阿拉丁山洞”,这个山洞被各机构的运营系统封锁起来。数据仓库就是打开这个信息山洞之门的钥匙。强有力的证据表明,我们在数据仓库领域的最初尝试(指的是第一代数据仓库)并未取得完全的成功。新生事物通常都不会非常成熟,在信息技术(盯)行业中更是如此,rr的从业人员迅速发现了数据仓库的潜力,他们试图努力使自己的公司在数据仓库方面保持竞争优势。在这样做的过程中,本人认为忽略了两个问题。第一点是,粗看上去,数据仓库似乎是一种相当简单的应用,事实上它一点也不简单。除了其绝对规模(数据仓库可能是世界上最庞大的一种数据库)和由此带来的性能瓶颈这个基本问题之外,其数据结构也比早期的类似系统天生要复杂得多。结果,造成设计过于简化,虽然数据库理解和使用起来很简单,但许多重要的问题没有考虑到。‘第二点是,数据仓库不像其他运行系统,它不能准确地定义需求。这与传统的系统不一样,传统系统由需求规范来驱动整个开发生命周期。我们的系统设计方法仍主要基于对需求的彻底理解,这是一种“硬性”的系统方法。而在数据仓库建造中,常常不知道要解决的问题是什么。数据仓库的部分任务应该是帮助公司了解他们的问题是什么。-关于设计,也有两个主要问题需要考虑。第一点与数据仓库本身有关。怎样保证相应的数据结构能解决一些较难的问题?第二点是已经证明硬性的系统方法限制性太强,需要一种更柔性的技术。因此,不仅要改进数据仓库的设计,还要改进实现这种设计的方法。作者针对这两个要求撰写了本书。第卜代数据仓库历史上,第一代数据仓库建立在业内大师们创立的某些法则的基础之上。作者很敬佩数据域中两位伟大的先行者:BiUInmon和RalphKimball。在我看来,这两位学者在数方面比别的人走得更远。虽然许多人声称自己“在有数据仓库这个称呼前已经从事建造工作很长时间了”,但实际上,Inmon和Kimball是数据仓库建造的奠基人,因地制定了今天大多数从业者所知道的定义和设计原则。纵使不能完全遵循他们的准Inmon关于数据仓库的定义和Kimball关于平缓地更改维的原则仍然是很常见的。本书第2章是对数据仓库的一个介绍。在某些方面,它应该被视为进行背景铺垫的一章,因为它给出了下列内容,从初步原理开始对数据仓库进行了介绍:决策支持的需求数据仓库有何用途运营系统和数据仓库之间的差别维模型数据仓库的主要成分第2章为介绍第二代数据仓库的发展做了铺垫,第二代数据仓库和客户关系管理在介绍数据仓库前,粗略地考察一下客户关系管理(CRM)的业务问题。数据仓库一直在等待CRM的出现。以前没有它,数据仓库仍比较流行,但其流行程度往往不够。IT管理人员很快会意识到数据仓库的潜力,但其业务需求并不总是主要的驱动力,这导致了某些数据仓库项目的失败。从业务经理的角度来看,发起这些大型的和昂贵的数据库开发项目总是有点勉强。由叮发起的那些数据仓库项目并不总是恰到好处。CRM的出现改变了一切。如果没有较多的信息资源(当然,它是数据仓库存在的理由),在业务开展中是不能实行CRM的。现在对数据仓库的兴趣已经有了新的活力,这次坐在“驾驶席”上的是业务人员。在介绍了CRM的概念和描述了它的主要成分后,将讨论第一代数据仓库的设计方法中的缺陷(具有事后总结的好处),并提出用于下一代设计的方法。本书从分析某些设计问题开始,然后仔细地选择解决更敏感的问题的方法,过去几年中,对这些更敏感问题存在一些争论(有时还很激烈)。基本问题之一是关于设计中的时间表示。对于这个问题的实际支持非常少,这是很可悲的,因为数据仓库已经成了所有业务中普遍的真正的基于时间的应用。在阐述解决方案时,我们针对有关时间的迷惑,再次介绍建造数据仓库的旧的概念、逻辑和实际方法。为什么应该做这件事存在很好的理由,在介绍过程中我们将会说明这些理由。有一章是关于建造数据仓库的业务理由的。意思很清楚。如果你不能说明开发数据仓库的理由,就不要建立它。如果我们设计和开发了一个漂亮的高性能的系统,但它不能在适当的时间内给出回报,任何人都不会为此感谢我们。许多数据仓库能够充分地证明自身存在的理由,而有的不能。我们不想造成失败项目。没有人能从这样的事情中得到好处,因此,在证明建立数据仓库的合理性方面,我们是相当严谨的。项目管理是数据仓库开发的一个关键部分。一般的项目管理方法在这里不适用。有许多经验丰富的项目管理者最初面对数据仓库项目时感到极不舒服。他们过去习惯了依赖于系统规格说明,但是数据仓库项目的交付产品具有不确定性,项目的接收标准本质上很不精确,这使他们感到很不安心。本书会提供项目管理方面的一些指导。认识我的人都认为我在软件产品方面有点“坦率”,但我觉得,如果我是一个诚实的人就应该这样。在碰到把旧的查询工具改头换面,就像它们是新产品一样随新东西一道发行的情形时,我就生气。过去,查询工具就是查询工具。现在,它是数据挖掘产品、分段产品,而且还是CRM产品。我知道,这些供应商要谋生,但作为职业顾问,我们必须保护客户(特别是容易受骗的客户),免得他们上这些供应商的当。有的产品确实增加了价值,而有的根本就没有增值,而且还非常昂贵。关于软件产品的那一章列出了各种可以得到的工具,说明它们擅长什么,不擅长什么,以及哪些问题你不关心,供应商就不会告诉你。本书读者本书涵盖了许多有意义的技术内容,其潜在的读者相当广泛。第2章是由本科生教材改编而来的,适合于希望学习数据仓库原理的人员。它用简单的术语说明了以下问题:.什么是数据仓库.怎样使用数据仓库.数据仓库的主要成分.数据仓库的“行话”这一章中还介绍了建造数据仓库要面对的困难和问题。对于顾问人员,本书包含了一个保证业务目标得以满足的方法。此方法是一个自顶向下的方法,它采用了常见的专题讨论会技术。还有一章专门帮助建立业务需求。对于数据仓库的开发人员,本书包含了关于设计(特别是在数据模型方面)、时间处理、概念、逻辑和物理层次的大量资料。本书还包含了对所有开发层次提供帮助的一个完整的方法学。重点集中在建立以客户为中心的模型上,这种模型对于支持客户关系管理的完整需求非常理想。对于项目管理人员,有一整章提供了关于方法的指南,同时还包括以下内容:完整的工作分解结构(WBS)项目组结构所需技能