数据库挖掘/数据仓库
-
数据淘金陈念贻著“金苹果”首先是为青少年朋友编写的,具有初中文化程度的读者基本上就可以看懂。当然,它们一定同样会受到渴求加深了解科学技术的成年读者的青睐。“金苹果”的作者们有一个共同的心愿,那就是使读者充分体验到,阅读科学书籍实在是一种妙不可言的美的享受。《金苹果文库》主要面向青少年,尽可能通俗地宣传和普及科学知识、科学思想和科学方法,规划出版5辑共50种图书。它的历程被誉为是“集结中国优秀科普作家队伍,展现中国优秀原创科普成果”的过程,前4辑出版后,至今已累计发行90万册,现在,随着第五辑的10种正式付印,“金苹果”产量终于闯过了百万大关。 -
数据结构实验徐孝凯,殷人昆 编著本书是一本实验教材,供全国电大系统的计算机科学与技术专业的学生学习数据结构课程时使用,该课程的主教材为清华大学出版社出版、殷人昆编著的《数据结构》一书。另外,本书也可以作为普通高校开设数据结构课程的实验教材或学习辅导书。本书包括9个实验,每个实验包括实验目的、预备知识、参考程序、实验要求等部分组成,全部实验涉及到数据结构课程的主要内容,通过上机实验操作能够大大提高学习效果和实践能力。本书附录中给出了该课程的综合练习题及参考解答。 -
数据仓储结构和实现(美)马克·汉弗莱斯(Mark Humphries),(美)迈克尔·W.霍金斯(Michael W.Hawkins),(美)米歇尔·C.戴(Michelle C.Dy)著;陈光群译本书详尽介绍了数据仓库的基本概念和企业在尽可能地保留已有信息技术系统投资下,如何经济有效地建立企业和数据仓库的方法。本书给数据仓储项目的参与人员提供最需要的,当前最佳解决方案的透彻的概述和建立满足他们目标仓库的可靠的逐步进行的过程。他回答了在数据仓库启动中的每个参与者、项目主办者,开发者,经理和首席信息官所提出的关键问题。读者对象:专业软件工程师、软件结构设计师、软件工程管理人员和MIS管理人员。 -
计算机密码学卢开澄编著全书共13章,叙述了密码学基本概念、分组密码、公钥密码、大数运算、密码协议、密钥管理等,第3版比第2版增加了大数运算、数字签名、密钥管理、密码协议等内容。在电子商务和电子政务的兴起和发展过程中,近代密码学扮演了十分活跃的角色。本书是在第2版的基础上,结合这几年密码学技术的发展改写而成。全书共13章,叙述了密码学基本概念、分组密码、公钥密码、大数运算、密码协议、密钥管理等,第3版比第2版增加了大数运算、数字签名、密钥管理、密码协议等内容,尤其对AES的加密标准及部分候选算法做了详细的介绍,并加强了与网络通信的保密安全相关的内容。本书可作为计算机专业或其他专业关于“网络通信保密安全”相关课程的教材或参考书。 -
数据挖掘与知识发现李雄飞,李军编著本书详尽地阐述了数据挖掘与知识发现领域中的一些基本理论和研究方法。介绍了KDD与数据据挖掘的概念、数据挖掘对象、知识发现过程、研究方法以及相关研究领域和应用范围。作为知识发现的数据预处理工作,简要叙述了数据清理、数据约简、数据概念等级分层、多维数据模型等内容。书中较详细地介绍了粗糙集、模糊集、聚类分析、关联规则、人工神经网络、分类与预测等数据挖掘方法,最后还简要介绍了多媒体数据挖掘工作的有关进展。本书可以作为计算机科学与技术专业和信息科学方向高年级本科生和研究生的教材或参考书,也可供有关科技人员学习参考。 -
数据仓库工具箱(美)Ralph Kimball,(美)Margy Ross著;谭明金译;谭明金译本书先介绍基本知识,然后逐个讨论具体实例内容,最后进行综合总体分析,在内容的结构方面很有特色。本书涉及的行业较多,但这些内容从不同角度体现了数据仓库的各个方面,因而对于完整的学习与掌握数据仓库知识显得十分必要。RalphKimball博士自1982年以来一直是数据仓库行业最主要的开拓者,并且是目前最知名的演讲人、咨询师与培训员之一。他是《智能企业》杂志的“数据仓库设计者”专栏的撰稿人,同时也是最畅销的《数据仓库生命周期工具箱》与《数据网库工具箱》两部著作的作者。本书主要介绍本书从维度建模的基本知识入手,通过给出零售、库存、采购、订单管理、顾客关系管理、账目、人力资源管理、财经服务、电信与公用事业、交通、教育、卫生护理、电子商务以及保险等方面的实例研究,全面、深入、透彻与具体地介绍了利用维度模型设计与开发数据仓库的综合技术知识。同时,本书对数据仓库在当前社会与技术背景下的发展前景进行了很有远见的探索。本书先介绍基本知识,然后逐个讨论具体实例内容,最后进行综合总体分析,在内容的结构方面很有特色。本书涉及的行业较多,但这些内容从不同角度体现了数据仓库的各个方面,因而对于完整的学习与掌握数据仓库知识显得十分必要。 -
数据仓库及其在电信领域中的应用段云峰[等]编著本书首先介绍了数据仓库及其一些基本概念,前3章详细介绍了数据仓库、数据挖掘、OLAP分析等技术内容,并对数据仓库建设的过程及应注意的问题等进行了阐述。从第4章开始,概要地分析了数据仓库在电信领域中的应用情况。在第5章中列举了一些具体的应用案例,介绍了数据仓库技术在电信领域中的应用。第6章和第7章概要地介绍了一些数据仓库产品和进行数据仓库产品测试需要考虑的内容,也包括TPC测试的一些内容,最后介绍了数据仓库各项技术的发展趋势。本书适合在电信领域从事数据仓库的读者学习参考,也可作为数据仓库爱好者的参考用书。 -
数据库系统全书(美)Hector Garcia-Molina等著;岳丽华等译;岳丽华译本书是斯坦福大学计算机科学专业数据库系列课程教科书。书中对数据库系统基本原理以及数据库系统实现进行了深入阐述,并对ODL、SQL、关系代数、面向对象查询、事务管理、并发控制等内容展开具体讨论。对该领域内的一些最新技术,诸如数据仓库、数据控掘、数据立方体系统等,也给予了介绍。??本书适合作为高等院校计算机专业研究生的教材或本科生的教学参考书,也适合作为从事相关研究或开发工作的专业技术人员的高级参考资料。??本书是斯坦福大学知名计算机科学家HectorGarcla-Molina、JeffreyD.Ullman和JenniferWidom合作编写的一本数据库系统引论书籍。书的前半部分从数据库设计者、用户和应用程序员的角度深入地介绍了数据库。包括最新数据库标准SQL—1999、SQLPSM、SQLCLI、ODL和XML,相比其他大多数书籍,更多地介绍了SQL内容。本书的后半部分是从DBMS实现的角度来介绍数据库的,覆盖了这个领域内的基本技术,并且比其他大多数书籍更多地介绍了查询优化。高级论题包括多维和位图索引、分布式事务处理和信息集成技术。本书既可用作大学教科书,也可作为该领域专业人员的参考书。??本书显著特色:??●使用人们普遍关注的、现实世界的例子提高可读性??●SQLPSM(持久存储模块)、JDBC(Java接口)和SQLCLI(ODBC或开放式数据库连接)等内容为本书所特有??●用ODMG标准ODL介绍了面向对象设计,用SQL—99标准介绍了对象—关系设计??●借助关系代数,讲述了查询处理和查询优化的扩展内容??●讨论了信息集成技术,包括数据仓库、协调器、OLAP、数据立方体和数据挖掘技术??●解释了很多重要的专门技术,如RAID盘的错误纠正、位图索引、统计数据的应用以及指针混合??●通过主页http:www-db.stanford.eduullmandscb.html提供本书更多的附加资料 -
数据仓库与数据挖掘武森,高学东,(德)M.巴斯蒂安著数据仓库技术是一种适用于决策支持系统的数据组织与管理技术,它不同于传统的数据库管理系统。数据仓库技术可以对计算机存储的信息进行提炼和加工,为企业领导提供集成化和历史化的数据,为企业全局的战略决策和长期趋势分析提供更有效的支持。 -
数据挖掘实践(美)Olivia Parr Rud著;朱扬勇等译;朱扬勇译OliviaParrRud是DataSquare,LLC的执行副总裁。Olivia在金融服务行业已经工作了二十多年,其中10年专门从事信用卡、保险、电信、零售、度假业、名录服务行业的数据挖掘、建模和划分工作。利用自己分析能力与创造才华,她提供客户获取、模型维护、风险、总盈利等方面的分析和解决方案。本书详细介绍了一种新的数据挖掘技术—数据建模,并着重阐述整个模型开发过程的细节。本书包括三个部分。第一部分讲述了基础知识,内容涉及确定目标和从商业预测中定义目标的重要性,并给出了收集数据和创建数据集的例子。第二部分通过一实例详甸阐述了模型开发的整个过程。第三部分通过应用于保险业、银行、电信行业的实例详细说明了不同目标的数据建模过程中的几个关键步骤。本书将数据挖掘的技艺用饮食烹调的思?爰右在故停子诶斫猓阌诮邮堋J橹懈龅闹诙嗍道浞痔逑至俗髡叨嗄甑男幸稻椋缘鼻暗氖谐∮涂突Ч叵倒芾斫>哂屑训慕杓饔谩1臼槭屎暇哂幸欢ǖ耐臣坪头治鼋;〉亩琳咴亩粒勺魑治鍪Α⑹萃诰蛉嗽薄⒂淼墓ぷ魇植幔部勺魑扑慊喙刈ㄒ档谋究粕芯可滩幕虿钩涠廖铩?"什么是数据挖掘数据挖掘(datamining)这个术语涵盖了应用于各个行业的多种技术。由于市场份额和利润竞争的日趋激烈,数据挖掘成为公司在客户生命周期的各个阶段维持竞争力的必要工具。过去,数据挖掘的形式之一也称为数据捕捞(datadredging)。这种方法曾被认为没有达到合格的研究标准。也就是说,研究人员实际上可能没有作任何预定义的假设就开始研究所有的数据。然而,由于这种形式的数据挖掘确实可以发现有价值的信息,所以它开始被广为接受。在美国的公司里,如果有一种方法可以发现如何提高利润,那么人们会迅速地接受、信赖它。20世纪80年代末至90年代初,另一种形式的数据挖掘开始在营销领域流行起来。几个技术领先的信用卡银行发现,有一种新的称为数据建模(datamodeling)的数据挖掘技术可以提高获得客户的能力,改进风险管理。大量的活动和空前的增长为数据建模的繁荣发展提供了肥沃的土壤。数据建模的成功和它所带来的利润为它在其他行业的应用铺平了道路。目前,使用数据建模技术进行营销的行业包括保险业、零售业、投资银行、公共事业部门、电信业、能源业、度假业、游戏业和药品行业等等。本书的重点许多统计理论的书都谈到了数据建模技术。但本书并不是那样的一本书!本书讨论的重点是在营销、风险和客户关系管理(CRM)中使用这些技术所需的实践知识。大部分公司都被数据挖掘软件工具?闹掷嗪凸δ芘醚刍ㄧ月摇H砑潭忌扑堑娜砑恰耙子谑褂谩焙汀拔扌枞魏畏治黾寄堋钡摹5牵颐且言诒玖煊蚬ぷ鞫嗄辏勒庑┕愀媸遣蛔阄诺摹H魏谓O钅康某晒Σ唤鼋鋈【鲇诙杂诜椒ㄑУ牧己美斫猓谷【鲇诙允荨⑹谐「驼迳桃的勘甑睦斫狻J率瞪希杂谡龉潭裕P痛砉讨皇瞧渲械囊恍〔糠帧?本书将着重阐述整个模型开发的过程。讨论的内容包括对商业或市场的预测,以及处理过程中所需的复杂的SAS代码。这是为了强调实际模型处理过程之前与之后的步骤的重要性。本书的读者随着数据挖掘应用的飞速发展,对资深分析师和数据挖掘师的需求也增加了。但是,由于此类人才短缺,公司便雇用有才华的统计学家或初级分析师,他们懂技术,但是缺乏必要的商业敏感性。公司也可能会购买复杂的数据挖掘软件工具,这些工具所提供的解决方案对分析技术知识,或者与目标相关的业务知识都知之甚少。不管是哪种情况,都有可能缺乏某些领域的知识,如定义目标的结构,获取和准备数据,确认和应用模型以及测量结果等。任何一个领域的错误都可能是灾难性的,会造成巨大的浪费。本书可作为不同级别的分析师、数据挖掘人员和营销经理的工作手册。本书提供了数据建模的逐步指导,尤其强调了必要的商业知识,以得到有益的结果。对于那些数据挖掘的初学者,本书可作为整个过程的综合指导。对于经验丰富的分析师而言,本书可以作为参考手册。最后,对于管理人员而言,阅读本书可以对成功运用数据模型所需的技术与过程有基本的了解。本书的结构本书分为三个部分。第一部分讲述基础知识。第1章讨论了确定目标和从商业角度定义目标的重要性。第2章讨论并提供了大量的例子,其中包括收集数据和创建建模数据集。第二部分通过一个案例研究,详细阐述了模型开发过程的每个步骤。第3章-第7章讨论了数据清洗、变量归约和转换、模型处理、验证、实施的步骤。第三部分提供一系列的案例研究,这些案例分别应用于保险业、银行、电信等行业,详细说明了不同目标的数据建模过程的几个关键步骤,包括特征、响应、风险和生命周期值。随着本书对模型开发步骤的深入探讨,作者加进了几位业内专家的合理建议,他们都是数据挖掘领域的先锋。这些建议对某个主题提出了不同看法,如多重共线性,建立生命周期值模型的其他方法等。所需工具要使用本书提供解决方案,读者要对统计学有基本的了解。如果你的目标是要得到管理层数据建模的使用建议,则需要进行准确的商业判断。本书所有的代码示例都是用SAS写的,为了在SAS上实现这些代码,用户需要BaseSAS和SAS/STAT。电子数据表都是用微软的Excel做成的。但是,基本的逻辑和指令对所有的软件包和建模工具都是有效的。配套光盘本书从第3章—第13章都包含了开发、验证和实施数据模型的SAS代码。对这些代码稍做修改,再加上一些常识,就能够从数据准备阶段到模型的开发与验证阶段建立一个模型。但是,这样需要大量的时间,还有可能出现编码错误。为了简化这项工作并使代码更容易地用于不同的数据模型,原出版社出版了配套光盘,但需要读者另行购买。光盘里包括了开发不同模型所需的全部代码,模型包括:响应、验证、流失、风险、生命周期值或净现值。开发目标函数的具体代码包括信用卡、保险、电信、名录服务的例子。代码中有清楚的注释,解释了每一个步骤的目的与方法,所需要的软件是BaseSAS和SAS/STAT。用于创建收益表和增幅图的电子数据表也包含在光盘中。通过SAS创建的初步分析结果可以得到这些表并加以使用。既然模型处理前后的步骤可以结合任何数据模型软件包来使用,代码自然也可以作为独立的建模模板。模型处理步骤重点在于逻辑递归上的数据准备。光盘上还包括用于变量验证和处理的SAS宏。本书没有涵盖的内容一本数据挖掘的书如果没有提到隐私权,那么就不能算是完整。我相信这是数据挖掘工作者的一项重要的工作。关于这个话题,可以再写一本书。所以,本书中没有谈到这一点。但是,我希望所有使用个人数据进行营销的公司都能制订一项隐私权的法规。要获得更进一步的信息和指导,请与DirectMarketingAssociation联系,电话(212)790-1500,或者访问他们的网站http://www.the-dma.org。小结有效的数据挖掘是科学与艺术的复杂混合体。数据挖掘工具的数量每年都在增长。研究人员不断开发新方法,软件厂商实现现有的方法,才华横溢的分析师则利用标准技术来推进过程。数据挖掘(说得具体一点,数据建模)已经成为公司维持利润的战略必备工具。希望本书可以成为你实现数据挖掘目标时方便的参考和恰当的向导。"
