数据库挖掘/数据仓库
-
数据统计分析与实践衷克定编著本书是作者十多年来对“数据统计分析”课程的教学和科研工作实践的结晶。本书从教育类专业用户的角度出发,结合作者对SPSS软件的教学和应用研究的经验,本着循序渐进的原则,在介绍数据统计分析的工具的同时,将统计学的知识溶入其中,详细介绍数据统计的新方法和新观点,且对应于每章均有综合的应用实例。其内容包括:现代教育研究方法概述、数据统计分析工具软件、数据的编码和编辑、数据整合、变量的描述统计分析、均值差异性的假设检验、非参数的假设检验、相关与回归分析、聚类分析与判别分析、因素分析等。本书可作为高等院教育类、心理学类、经济类等各个专业的本科生和相关专业研究生的教材,亦可作为相关领域研究人员的参考书。 -
Web数据仓库构建指南(美)Ralph Kimball,(美)Richard Merz著;张丽萍等译;张丽萍译在这本极富创造性的指南中,数据仓库领域最畅销的作用Ralph Kimball向读者介绍了Web数据仓库——Web数据仓库和Web之间的姻缘。如果设计和部署都很完美,Web仓库将会成为当代以客户为中心的公司的关键,向经理和战略决策者提供对他们而言至关重要的竞争信息。在本书中,Kimball博士阐述了Web仓库的关键元素,为设计、构建和管理Web仓库提供了详细的指导说明。仔细品读本书,将可以帮助您的企业更好地保持健康且极具竞争力的发展态势。 在此书中,您将要学习如下方法: 跟踪网站的用户操作 判断客户是否会转向竞争对手 判断特定的Web广告是否正常运行 捕获有关客户行为的数据 设计支持Web仓库的网站 构建点击流市场 管理和缩放Web数据仓库 -
数据库设计与开发教程(美)Paulraj Ponniah著;韩宏志译;韩宏志译信息是企业的主要资产,数据库是企业的重要信处一源。只有通过数据库,企业才能获取关键信息,才能充分利用日臻完善的电子商务,才能紧随经济全球化大潮。数据库技术发展之快,包含主题之广,体第增长之快,令人目不暇接。为完成规划、设计、实现、部署和维护数据库的任务,必须牢固掌握基本技术,深入理解基本知识。本书以循序渐进的方式,全面分析了数据库的设计和开发方法,系统地阐述了数据库设计和开发的基本原理。内容和结构的安排均有利于相关课程的教学工作。本书适合作为高等院校计算机科学专业数据库课程教材。也可供企业的IT人员在为公司建立正确的数据库环境时进行参考。本书主要内容数据库系统的目的是什么数据库系统包含哪些组件公司需要捕获哪些数据类型如何实现特殊目标设计数据库如何通过数据建模捕获信息如何确过哪个数据库最符合业务目标的要求有效的数据库管理和维护涉及哪些内容数据库系统如何与Internet资源整合第I部分数据库基本概念信息是企业的主要资产,数据库是企业的重要信处一源。只有通过数据库,企业才能获取关键信息,才能充分利用日臻完善的电子商务,才能紧随经济全球化大潮。数据库技术发展之快,包含主题之广,体第增长之快,令人目不暇接。为完成规划、设计、实现、部署和维护数据库的任务,必须牢固掌握基本技术,深入理解基本知识。本书以循序渐进的方式,全面分析了数据库的设计和开发方法,系统地阐述了数据库设计和开发的基本原理。内容和结构的安排均有利于相关课程的教学工作。本书适合作为高等院校计算机科学专业数据库课程教材。也可供企业的IT人员在为公司建立正确的数据库环境时进行参考。本书主要内容数据库系统的目的是什么数据库系统包含哪些组件公司需要捕获哪些数据类型如何实现特殊目标设计数据库如何通过数据建模捕获信息如何确过哪个数据库最符合业务目标的要求有效的数据库管理和维护涉及哪些内容数据库系统如何与Internet资源整合第I部分数据库基本概念 -
数据挖掘教程Margaret H.Dunham著;郭崇慧[等]译;郭崇慧译数据挖掘技术是多学科交叉的新兴技术,它是随着数据的大量积累以及市场竞争对信息与知识的迫切需求而产生和发展起来的,并逐渐成为人们关注的热点。人们希望通过数据挖掘技术找到蕴藏在数据中的有用信息,进而找到尚未发现的知识,为商业竞争、企业生产和管理、政府部门决策以及科学探索等提供信息与知识,这种所谓隐藏在数据中的信息与知识是人的先验知识和经验无法确定的,对于帮助人们作出适当决策是很有价值的。 数据挖掘技术是在统计学、人工智能(特别是机器学习)和数据库技术等多种技术的基础上发展起来的。数据挖掘强调的是大数据量和算法的可伸缩性,它是一门很接近实用的学科,一出现就被许多部门所应用。由于它的实用性和商业效益,近年来人们研究出许多数据挖掘的新方法,并开发了许多数据挖掘的新产品。 本书从数据库的角度对数据挖掘的基本方法和算法进行了系统的介绍。全书共分三部分: 第1部分包括第1~3章,介绍数据挖掘的发展和基本概念;第2部分包括第4~6章,介绍最基本的数据挖掘方法,这部分也是全书的重点;第3部分包括第7~9章,介绍了近年来出现的较新的数据挖掘方法和领域。每章最后两节均为练习和参考文献注释。一部分练习用于检验学生掌握书中所述概念和知识的情况,另一部分练习提出需要进一步研究和思考的问题。每章的参考文献注释则较详细地说明了该章涉及的方法与算法的发展历程和状况,作者花费了很大精力查阅和收集这方面的资料。 本书适合作为计算机专业研究生及高年级本科生教材。作为教科书,书中的内容有一定的深度和广度,对许多方法和算法都作了引导性的叙述。但作为一本基础性的教科书,它不可能包括太广的内容,对近年来发展较快的一些新方法,如粗糙集、贝叶斯网络和支持向量机等,书中并未深入叙述。要想更深入地掌握一些方法和提出改进建议,还需要查阅书中给出的参考文献和一些方法的最新进展。本书还可作为相关领域科技人员的参考书。 作者在她本人的网页上给出了英文原著的演示文稿和勘误表,有兴趣的读者可查阅http://www.engr.smu.edu/~mhd/。除作者给出的勘误之外,译者也发现一些错误和疑似错误之处,在译文中对一般拼写错误、笔误和明显的小错误均未作说明而直接给出了校正,对较大一些的错误则在相应页中的脚注中给出了说明。 郭崇慧博士翻译了第1、4、5章,田凤占博士翻译了第2、6章,靳晓明博士翻译了第3、8、9章,孙建涛博士生翻译了第7章,沈抖硕士生翻译了附录。丛艳硕士参加了部分翻译和校对工作,鲁明羽博士也参加了部分校对工作。陆玉昌教授统一组织了全书的翻译和校对工作,并审阅定稿。 由于译者知识和水平所限,出现错误及疏漏之处敬请指正 译者 2004年4月 -
数据仓库及其在电信领域中的应用段云峰[等]编著本书首先介绍了数据仓库及其一些基本概念,前3章详细介绍了数据仓库、数据挖掘、OLAP分析等技术内容,并对数据仓库建设的过程及应注意的问题等进行了阐述。从第4章开始,概要地分析了数据仓库在电信领域中的应用情况。在第5章中列举了一些具体的应用案例,介绍了数据仓库技术在电信领域中的应用。第6章和第7章概要地介绍了一些数据仓库产品和进行数据仓库产品测试需要考虑的内容,也包括TPC测试的一些内容,最后介绍了数据仓库各项技术的发展趋势。本书适合在电信领域从事数据仓库的读者学习参考,也可作为数据仓库爱好者的参考用书。 -
数据仓库与数据挖掘技术夏火松主编《数据仓库与数据挖掘技术(第2版)》详细阐述了数据仓库与数据挖掘的基本原理,系统而全面地介绍了数据仓库与数据挖掘的概念、作用、算法和应用举例,并且给出了信息分析所涉及到的若干问题及框架。《数据仓库与数据挖掘技术(第2版)》介绍了最新的信息分析技术研究成果,如小波分析、Rough分析、蚁群分析、分形技术、Agent、数据挖掘的进化算法、聚类分析、非结构数据的挖掘、离群数据挖掘,但并未详细描述,而将介绍重点放在其应用上,起到抛砖引玉的作用。《数据仓库与数据挖掘技术(第2版)》既可以作为信息管理与信息系统、计算机应用、经济管理等专业的高年级本科生和研究生的教材,又可以作为有关在经济管理领域中应用信息分析技术提高决策人员的参考。 -
Excel与化学化工试验数据处理胡亮,杨大锦编著微软公司的Excel是集文字、数据、图表处理于一体的,并能进行数据计算和统计分析的电子表格软件。其操作简单,所见即所得。本书简要介绍Excel电子表格应用基础知识,并在此基础上结合大量化学化工实例,重点介绍Excel试验数据分析及应用,能满足化学化工工作者进行试验设计和数据处理工作的需要。附赠光盘中根据书中出现的实例和有关Excel电子表格图示,按照篇章整理出了相应的Excel电子表格,方便与书中实例对照学习。同时以Excel电子表格的形式,摘录了部分实验用表,方便参考。本书适用于化学化工科技工作者和科研人员阅读,也可作为化学化工相关专业教师、学生用教材。 -
数据仓库原理、设计与应用陈京民编著本书全面、系统地介绍了数据仓库的原理、开发和应用技术。主要内容包含数据仓库、联机分析处理和数据挖掘的基本概念、体系结构、开发模型、项目规划、创建过程和应用管理,涵盖了数据仓库的完整生命周期。本书力求从务实的角度出发,揭开笼罩在数据仓库、联机分析处理和数据挖掘上面的神秘面纱,使读者能对数据仓库、联机分析处理和数据挖掘有一个正确认识,以推动数据仓库在我国的健康发展。为使读者能够从各种角度对数据仓库进行全面系统的了解,并满足不同人员的需要,本书在介绍数据仓库、联机分析处理和数据挖掘的原理、设计与应用全过程的同时还介绍了一个超市数据仓库规划、设计与实施的完整过程,并在其中穿插介绍了SQL Server 2000中的数据仓库开发工具的具体应用,为读者对数据仓库的了解提供了实际参考框架。本书适合于企业各个层次的管理人员、项目开发人员,也可以作为相关专业本科生和研究生的教材。本书为授课教师免费提供电子教案,此教案用PowerPoint制作,可以任意修改。需要者可以从中国水利水电出版社网站www.waterpub.com.cn下载,也可与北京万水电子信息有限公司联系,联系电话:(010)82564395。 -
数据建模与决策刘国山等编著“数据建模与决策”课程的教学目的是以教授应用技能为主。由于实际问题异常复杂,几乎所有数据的处理和模型的解决都需要借助计算机来实现,因此,选择什么样的软件来处理就是一个问题。如果选择非常专业的软件,则要花费许多时间学习如何使用这些软件,从而影响教学的其他环节。但是,使用比较方便的软件一般又不能有效地解决问题。而且,如果统计部分和管理科学部分使用不同的软件,那么学生就需要在短时间内掌握两个或两个以上的软件的操作。???虽然全国MBA教育指导委员会在对于MBA教学检查的要求中对“数据建模与决策”课程的教学案例未做要求,但是,各个学校及其MBA学生对于案例教学的热中使得我们在教学中不得不重视案例教学问题。这给本来时间压力就比较大的“数据建模与决策”课程的教学任务又增添了新的困难。这也是我们编写《数据建模与决策》教材所必须面对的问题。基于编写《数据建模与决策》教材所面临的问题,编写者们经过集体协商,决定以中国人民大学MBA的“数据建模与决策”课程的基本教学内容为主,同时参考大连理工大学管理学院的教学内容,来编写可供一个学期的课程所使用的教材。在内容选取上,我们以介绍统计内容为主,适当地介绍一些管理科学方面的模型。这样做的主要原因是教学时数的限制,在有限的时间内是很难完成太多的教学任务的。???我们参照国外的MBA教材,确定了以案例为先导,然后介绍相关知识,最后以一般的练习来巩固知识,并在解决问题的过程中强调计算机软件的利用的写作方式。至于案例作业,我们没有编写,其主要原因是现在有许多的案例教材可以选用。由于在实际应用中数量分析方法所涉及的数据的规模一般都很大,需要通过相应的计算机软件来实现,因此经过商议,在向国内外同行进行咨询的基础上,我们决定在《数据建模与决策》教材中主要以Excel作为工具来解决教材中几乎所有的计算问题,包括管理科学中的计算和统计数据的处理。这样做的原因是Excel软件应用比较普及,几乎在任何一台电脑上都可以使用Excel。而且,Excel操作简单,比较容易学习,不会占用太多的教学时间。同时,电子表格也是现在企业管理中一个非常有用的工具。???本书第1章由深圳大学管理学院李丽教授编写,第2章至第11章由中国人民大学统计系的贾俊平教授编写,第12章和第13章由中国人民大学商学院的刘国山教授编写,第14章和第15章由大连理工大学管理学院的胡祥培教授编写。邓茶亚、陈守龙和谭英平也参加了编写工作。 -
数据仓库设计(美)Claudia Imhoff,(美)Nicholas Galemmo,(美)Jonathan G.Geiger著;于戈[等]译;于戈译大多数数据仓库的管理者、设计者和开发者都熟悉Ralph Kimball在2001年写给数据仓库界的那封公开信。在信中,他向Inmon阵营提出了挑战,要求回答关于关系式方法有效性的棘手问题。由最著名的Inmon方法专家:Claudia Imhoff和其他作者合写的这本书,正面回答了Kimball公开信中提出的挑战性问题,并为在复杂的业务智能环境中如何正确地应用关系式和多维式两种建模技术提供了指导。 主要内容如下:●在已经囊括了所有行业的各种公司的数据仓库环境中,已知哪种方法是最成功的●给出了关系方法和多维方法的正反两方面意见对比,开发者可以确定最适合的方法●为什么体系结构应该包括建立在关系数据模型概念之上的数据仓库●键的构造和使用,数据仓库、层次及事务型数据的历史性质●为了保证数据仓库能满足较好的性能要求,所需要解决的技术问题●为保证最优数据仓库性能和处理随时间变化的数据,所需要的关系建模技术本书全面论述了设计和建立高效、可持续发展且可扩展的数据仓库的方法,重点论述了建立各种数据模型的方法。主要内容包括业务智能环境和数据模型的概念、数据模型分类、数据模型的开发步骤、各种数据的建模方法、数据仓库的优化与扩展、数据模型的维护、关系型解决方案的部署、多维体系结构与企业信息工厂的比较等。本书主要面向数据仓库的设计者和构建者以及数据仓库技术研究人员,同时也适合对数据仓库技术和企业信息化建设感兴趣的其他读者阅读。
