数据库挖掘/数据仓库
-
数据结构(C语言版)周星主编本书共分9章,用通俗易懂的语言,深入浅出地介绍了各种数据结构的基本概念、逻辑特性与物理结构,并详细介绍了有关的算法和分析,用类C语言描述了绝大部分的算法。另外还介绍了有关检索与排序技术。本书可供高职院校信息类专业学生使用,也可作为普通专科学校和成人教育学院相近专业学生的教材。 -
疑难数据仓库专家解决方案(美)Sid Adelman等著;冯宏等译;冯宏译本书的第1篇讨论管理方面的难以应付的情况,第2篇研究技术方面的难以应付的情况。这两篇中的讨论顺序大体上就是开发一个项目遇到这些情况的顺序,但是每一章都独立于它前面的各章节。读者可以从头至尾地阅读本书,但不必拘泥于这种阅读方式;读者也可以直接跳到讨论了给你造成最大麻烦的那些问题的章节。例如,如果读者目前正受困于数据质量问题,那么讨论数据质量的第11章可能就是你开始阅读的好地方。各章的每一节都介绍一个与本章主题相关的难以应付的情况,接着给出每位专家所建议的解决方案(按专家姓氏的字母顺序介绍)。SidAdelman是SidAdelman&Associates的创始人,这是一个专门从事规划与实现数据创库的组织。他经常出席数据仓库会议,并指导一个数据仓库的组织。他经常出席数据仓库会议,并指导一个数据仓库项目管理的研究组。Sid还是BIAIIiance的一名创办成员。他参与开发了一种为实现数据仓库提供一份主要计划的方法学。他曾和LarissaMoss合著了《数据仓库项目管理》一书。本书主要介绍正常运作的数据仓库对组织的成功是至关重要的,但建设和维护任一数据仓库都会充满难以预料的危险或困难。本书介绍了各种类型、规模和结构的公司都会面临的91种常见疑难及其解决方案。9位数据仓库建设方面的权威专家对这些看似难以应付的危机各抒己见,并给?笠倒芾砣嗽薄T经理与职员以及终端用户提供了防止和拯救这些危机的具体措施。本书的第一篇解决难以应付的各种管理问题,其中包括薄弱的组织支持、不切实际的进度安排和职员配备问题。第二篇重点关注各种技术挑战,比如安全、集成和性能。本书通过实际的示例,从多种角度提供了实用的解决方案。另外,还为希望进一步阅读的读者推荐了大量资源,并在书后提供了覆盖专业词汇与同义词的词汇表及口语词汇表。 -
企业网关管理器应用指南本丛书编委会编写本书是Informix管理与维护丛书之一。该书全面系统地介绍了Windows NT平台下的Informix企业网关管理器的应用、管理、开发和维护技术。全书由7章和3个附录构成。内容包括:网关管理器基础知识,网关管理器的安装,网关管理器的配置,egmdba实用程序,使用网关管理器编程,错误处理,bckeckegm实用程序,全球语言支持,附录讨论了ODBC驱动程序需求,第三方服务器和驱动程序信息和故障诊断等。本书从网关管理器的基本知识入手,通过实例,由浅入深的讲解,全面地介绍了Informix网关管理器及其相关技术。本书内容丰富、全面、新颖,条理清楚,通俗易懂,并附有大量的实例,不但是从事Informix数据库管理、应用、开发和维护人员的重要的技术指导书,同时也是广大数据库编程员、高等院校相关专业师生自学、教学参考用书和各科研院所、图书馆重要的馆藏读物。本书光盘内容为与本书配套电子书。 -
数据库应用技术吴文庆,李桂杰主编本教材有以下特点:1.结构合理。在经过系统的知识介绍后,学生所做的实例累计后,就是一套可应用的小型数据应用系统。简化对名词、术语和概念的繁锁陈述,以最快捷的路径直奔主题,重点讲述具体的制作环节。2.通谷易懂、深入浅出,整个叙述过程采用了大量新颖图标的形式,有助于增强学生学习兴趣、开成正确思路和提高对本教材的认知程度,从而快速、轻松地掌握VisualFoxPro6.0的可视化编程。3.抛弃了传统数据库教材中验证性的实例演示,偏重可视化编程与数据库设计相结合,将数据库技术、可视化编程的方法、语言学习与实际应用作为一个整体来介绍。最后通过设计一个具体实用的管理程序,使读者掌握实际应用程序的开发技术。4.按照高职教学目标的基本要求,较好地处理了数据库中各类知识的过渡,本教材并非孤立地介绍了VisualFoxPro6.0系统的使用,而是全面兼顾了知识点的前后呼应。5.突出应用能力的培养。尽量以通俗易懂的语言阐述基本理论以及程序设计过程,适当突出了实训和练习,有助于学生加深对基本概念的理解和掌握。 -
Web数据库设计与应用林闯主编ActiveServerPages.NET(ASP.NET)是迄今为止微软最新的Web开发平台。中央广播电视大学以实际市场需求为导向,在人才培养模式改革和开放教育试点“软件开发与应用专业”中引入了这一最新技术,本书既是统设必修专业核心课“Web数据库设计与应用”之配套教材。全书围绕使用ASP.NET技术进行数据库开发为核心,逐步介绍了进行ASP.NET数据库开发必备的基础知识(.NET背景、VB.NET语言、ASP.NET控件等),在第六章通过案例详细介绍了使用数据库控件进行Web开发的技术,最后三章则对代码分熟、安全设计和应用程序相关内容作了介绍。本书是ASP.NET开发的入门教材,为了符合实用和便于自学的特点,全书主要通过案例进行相关知识点的介绍。在涉及到相关技术时,也仅从如何使用的角度进行介绍,并不涉及太多的理论。另外,本书的重点是使用ASP.NET技术进行数据库开发,限于篇幅,对VB.NET语言和ADO.NET技术也仅从满足ASP.NET最基本开发的角度作简单介绍。学生学习本书的同时,也可以参照本专业另外一门课程《.NET编程基础》配套教材中VB.NET语言、NET框架技术、ADO.NET技术的相关内容。对于希望快速了解ASP.NET和ADO.NET的数据库开发人员,尤其是熟悉ASP以前版本的开发人员,通过本书相关案例的介绍或练习,能够快速获得和提高.NET开发的技能。 -
SAP EAM设备维护系统应用及案例汪昌任著本书特点:蕴涵SAP管理应用系统的思想和最佳业务实践模型;国内第一全方位介绍EAM系统体系、流程和模型的著作,涵盖了EAM中基本数据、预防性维护、工单、物资、项目、成本和分析等管理范畴;内容源于国内外的应用实施经验,对于业务实践具有很强的指导意义;以应用实践的业务情景和案例分析为主线,图文并茂地阐述SAPEAM设备维护系统的应用。本书读者:机械、化工、电力、石油、交通等资产密集型企业的设备管理人员;企业EAM系统的实施团队;EAM理论和应用的研究人员;管理咨询公司和应用软件公司的咨询顾问;大中专院校的管理、机械或工程类师生;有志于进入SAP领域的其他人士。资产密集型企业的核心竞争力是企业资产管理,而EAM(enterpriseassetmanagement)系统则是必备的工具之一,是RCM和TPM等设备维护先进管理理念的技术平台。应用EAM系统,企业可在不增加维修费用的情况下,明显地降低停机时间,增加生产产量。本书介绍了完整的SAPEAM系统体系,包括理论、业务流程和系统功能,并通过介绍国际企业的应用案例,对企业的应用实践具有很强的指导意义。读者从中可以了解到企业设备维护系统建设的完整流程:从组织结构设计、基础数据(技术对象)管理,到预防计划、故障维修和维护执行,到零备件管理和工作清场管理,以及成本管理和报表分析等。读者将得到基本的系统应用知识及行业实践经验。本书既可满足企业EAM系统实施团队的理论研究和实践参考需求,也可作为机械、化工、电力、石油、交通等资产密集型企业的设备管理人员的培训教材。 -
数据挖掘与知识发现李雄飞,李军编著本书详尽地阐述了数据挖掘与知识发现领域中的一些基本理论和研究方法。介绍了KDD与数据据挖掘的概念、数据挖掘对象、知识发现过程、研究方法以及相关研究领域和应用范围。作为知识发现的数据预处理工作,简要叙述了数据清理、数据约简、数据概念等级分层、多维数据模型等内容。书中较详细地介绍了粗糙集、模糊集、聚类分析、关联规则、人工神经网络、分类与预测等数据挖掘方法,最后还简要介绍了多媒体数据挖掘工作的有关进展。本书可以作为计算机科学与技术专业和信息科学方向高年级本科生和研究生的教材或参考书,也可供有关科技人员学习参考。 -
统计学习基础(美)Trevor Hastie等著;范明等译;范明译随着计算机和信息时代的到来,统计问题的规模和复杂性都有了急剧增加。数据存储、组织和检索领域的挑战导致一个新领域“数据挖掘”的产生。数据挖掘是一个多学科交叉领域,涉及数据库技术、机器学习、统计学、神经网络、模式识别、知识库、信息提取、高性能计算等诸多领域,并在工业、商务、财经、通信、医疗卫生、生物工程、科学等众多行业得到了广泛的应用。本书试图将学习领域中许多重要的新思想汇集在一起,并且在统计学的框架下解释它们。尽管有些数学细节是必要的,但本书强调的是方法和它们的概念基础,而不是理论性质。本书内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的,适合从事数据挖掘和机器学习研究的读者阅读。TrevorHastie,RobertTibshirani和JeromeFriedman都是斯坦福大学统计学教授,并在这个领域做出了杰出的贡献。Hastie和Tibshirani提出了广义和加法模型,并出版专著“GeneralizedAdditiveModels”。Hastie的主要研究领域为:非参数回归和分类、统计计算以及生物信息学、医学和工业的特殊数据挖掘问题。他提出主曲线和主曲面的概念,并用S-PLUS编写了大量统计建模软件。Tibshirani的主要研究领域为:应用统计学、生物统计学和机器学习。他提出了套索的概念,还是“AnIntroductiontotheBootstrap”一书的作者之一。Friedman是CART、MARS和投影寻踪等数据挖掘工具的发明人之一。他不仅是位统计学家,而且是物理学家和计算机科学家,先后在物理学、计算机科学和统计学的一流杂志上表发论文80余篇。计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语来表达。本书介绍了这些领域的一些重要概念。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。本书内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的。本书可作为高等院校相关专业本科生和研究生的教材,对于统计学相关人员、科学界和业界关注数据挖掘的人,本书值得一读。 -
数据挖掘实践(美)Olivia Parr Rud著;朱扬勇等译;朱扬勇译OliviaParrRud是DataSquare,LLC的执行副总裁。Olivia在金融服务行业已经工作了二十多年,其中10年专门从事信用卡、保险、电信、零售、度假业、名录服务行业的数据挖掘、建模和划分工作。利用自己分析能力与创造才华,她提供客户获取、模型维护、风险、总盈利等方面的分析和解决方案。本书详细介绍了一种新的数据挖掘技术—数据建模,并着重阐述整个模型开发过程的细节。本书包括三个部分。第一部分讲述了基础知识,内容涉及确定目标和从商业预测中定义目标的重要性,并给出了收集数据和创建数据集的例子。第二部分通过一实例详甸阐述了模型开发的整个过程。第三部分通过应用于保险业、银行、电信行业的实例详细说明了不同目标的数据建模过程中的几个关键步骤。本书将数据挖掘的技艺用饮食烹调的思?爰右在故停子诶斫猓阌诮邮堋J橹懈龅闹诙嗍道浞痔逑至俗髡叨嗄甑男幸稻椋缘鼻暗氖谐∮涂突Ч叵倒芾斫>哂屑训慕杓饔谩1臼槭屎暇哂幸欢ǖ耐臣坪头治鼋;〉亩琳咴亩粒勺魑治鍪Α⑹萃诰蛉嗽薄⒂淼墓ぷ魇植幔部勺魑扑慊喙刈ㄒ档谋究粕芯可滩幕虿钩涠廖铩?"什么是数据挖掘数据挖掘(datamining)这个术语涵盖了应用于各个行业的多种技术。由于市场份额和利润竞争的日趋激烈,数据挖掘成为公司在客户生命周期的各个阶段维持竞争力的必要工具。过去,数据挖掘的形式之一也称为数据捕捞(datadredging)。这种方法曾被认为没有达到合格的研究标准。也就是说,研究人员实际上可能没有作任何预定义的假设就开始研究所有的数据。然而,由于这种形式的数据挖掘确实可以发现有价值的信息,所以它开始被广为接受。在美国的公司里,如果有一种方法可以发现如何提高利润,那么人们会迅速地接受、信赖它。20世纪80年代末至90年代初,另一种形式的数据挖掘开始在营销领域流行起来。几个技术领先的信用卡银行发现,有一种新的称为数据建模(datamodeling)的数据挖掘技术可以提高获得客户的能力,改进风险管理。大量的活动和空前的增长为数据建模的繁荣发展提供了肥沃的土壤。数据建模的成功和它所带来的利润为它在其他行业的应用铺平了道路。目前,使用数据建模技术进行营销的行业包括保险业、零售业、投资银行、公共事业部门、电信业、能源业、度假业、游戏业和药品行业等等。本书的重点许多统计理论的书都谈到了数据建模技术。但本书并不是那样的一本书!本书讨论的重点是在营销、风险和客户关系管理(CRM)中使用这些技术所需的实践知识。大部分公司都被数据挖掘软件工具?闹掷嗪凸δ芘醚刍ㄧ月摇H砑潭忌扑堑娜砑恰耙子谑褂谩焙汀拔扌枞魏畏治黾寄堋钡摹5牵颐且言诒玖煊蚬ぷ鞫嗄辏勒庑┕愀媸遣蛔阄诺摹H魏谓O钅康某晒Σ唤鼋鋈【鲇诙杂诜椒ㄑУ牧己美斫猓谷【鲇诙允荨⑹谐「驼迳桃的勘甑睦斫狻J率瞪希杂谡龉潭裕P痛砉讨皇瞧渲械囊恍〔糠帧?本书将着重阐述整个模型开发的过程。讨论的内容包括对商业或市场的预测,以及处理过程中所需的复杂的SAS代码。这是为了强调实际模型处理过程之前与之后的步骤的重要性。本书的读者随着数据挖掘应用的飞速发展,对资深分析师和数据挖掘师的需求也增加了。但是,由于此类人才短缺,公司便雇用有才华的统计学家或初级分析师,他们懂技术,但是缺乏必要的商业敏感性。公司也可能会购买复杂的数据挖掘软件工具,这些工具所提供的解决方案对分析技术知识,或者与目标相关的业务知识都知之甚少。不管是哪种情况,都有可能缺乏某些领域的知识,如定义目标的结构,获取和准备数据,确认和应用模型以及测量结果等。任何一个领域的错误都可能是灾难性的,会造成巨大的浪费。本书可作为不同级别的分析师、数据挖掘人员和营销经理的工作手册。本书提供了数据建模的逐步指导,尤其强调了必要的商业知识,以得到有益的结果。对于那些数据挖掘的初学者,本书可作为整个过程的综合指导。对于经验丰富的分析师而言,本书可以作为参考手册。最后,对于管理人员而言,阅读本书可以对成功运用数据模型所需的技术与过程有基本的了解。本书的结构本书分为三个部分。第一部分讲述基础知识。第1章讨论了确定目标和从商业角度定义目标的重要性。第2章讨论并提供了大量的例子,其中包括收集数据和创建建模数据集。第二部分通过一个案例研究,详细阐述了模型开发过程的每个步骤。第3章-第7章讨论了数据清洗、变量归约和转换、模型处理、验证、实施的步骤。第三部分提供一系列的案例研究,这些案例分别应用于保险业、银行、电信等行业,详细说明了不同目标的数据建模过程的几个关键步骤,包括特征、响应、风险和生命周期值。随着本书对模型开发步骤的深入探讨,作者加进了几位业内专家的合理建议,他们都是数据挖掘领域的先锋。这些建议对某个主题提出了不同看法,如多重共线性,建立生命周期值模型的其他方法等。所需工具要使用本书提供解决方案,读者要对统计学有基本的了解。如果你的目标是要得到管理层数据建模的使用建议,则需要进行准确的商业判断。本书所有的代码示例都是用SAS写的,为了在SAS上实现这些代码,用户需要BaseSAS和SAS/STAT。电子数据表都是用微软的Excel做成的。但是,基本的逻辑和指令对所有的软件包和建模工具都是有效的。配套光盘本书从第3章—第13章都包含了开发、验证和实施数据模型的SAS代码。对这些代码稍做修改,再加上一些常识,就能够从数据准备阶段到模型的开发与验证阶段建立一个模型。但是,这样需要大量的时间,还有可能出现编码错误。为了简化这项工作并使代码更容易地用于不同的数据模型,原出版社出版了配套光盘,但需要读者另行购买。光盘里包括了开发不同模型所需的全部代码,模型包括:响应、验证、流失、风险、生命周期值或净现值。开发目标函数的具体代码包括信用卡、保险、电信、名录服务的例子。代码中有清楚的注释,解释了每一个步骤的目的与方法,所需要的软件是BaseSAS和SAS/STAT。用于创建收益表和增幅图的电子数据表也包含在光盘中。通过SAS创建的初步分析结果可以得到这些表并加以使用。既然模型处理前后的步骤可以结合任何数据模型软件包来使用,代码自然也可以作为独立的建模模板。模型处理步骤重点在于逻辑递归上的数据准备。光盘上还包括用于变量验证和处理的SAS宏。本书没有涵盖的内容一本数据挖掘的书如果没有提到隐私权,那么就不能算是完整。我相信这是数据挖掘工作者的一项重要的工作。关于这个话题,可以再写一本书。所以,本书中没有谈到这一点。但是,我希望所有使用个人数据进行营销的公司都能制订一项隐私权的法规。要获得更进一步的信息和指导,请与DirectMarketingAssociation联系,电话(212)790-1500,或者访问他们的网站http://www.the-dma.org。小结有效的数据挖掘是科学与艺术的复杂混合体。数据挖掘工具的数量每年都在增长。研究人员不断开发新方法,软件厂商实现现有的方法,才华横溢的分析师则利用标准技术来推进过程。数据挖掘(说得具体一点,数据建模)已经成为公司维持利润的战略必备工具。希望本书可以成为你实现数据挖掘目标时方便的参考和恰当的向导。" -
数据融合理论与应用康耀红著数据融合是许多传统学科和新兴工程领域相结合而产生的一个新的前沿技术领域,是现代C3I系统的重要组成部分。本书首版是我国第一本关于多传感器数据融合理论的专著,这次修订,纠正了个别遗错。.全书共分12章。第一章阐述数据融合的意义、理论基础、实现技术和研究现状,第二章和第三章研究多传感器目标检测理论和性能评估;第四章至第八章论述数据关联和目标跟踪的算法与理论;第九章介绍身份估计的基本思想与方法;第十章至第十二章介绍态势评估和威胁估计的基本理论,以及在这一领域有广泛应用前景的条件事件代数理论和规划识别理论。..本书适用于通信、控制和信号处理等领域的大学生、研究生和相关领域的科研、工程技术人员。...
