数据库挖掘/数据仓库
-
数据挖掘朱明 编著数据挖掘技术,又称为数据库知识发现,是20世纪90年代在信息技术领域开始迅速发展起来的计算机技术。作者结合自己近20年从事人工智能、机器学习、数据挖掘等方面的科研工作积累与教学经验,编著此书。本书较全面系统地介绍了数据挖掘中常用和常见的数据挖掘方法,以及文本与视频数据挖掘方法。本书的主要内容包括:数据挖掘基本知识、数据挖掘预处理方法、决策树分类及其他分类方法、关联知识挖掘方法、各种聚类分析方法,以及文本挖掘所涉及表示、分类和聚类等方法,还包括视频挖掘所涉及的视频镜头检测、字幕提取、视频摘要和视频检索等主要分析方法。本书作为学习、掌握和应用数据挖掘方法和技术的综合指导书,是从事数据挖掘研究与应用人员,以及希望了解数据挖掘主要方法和技术的IT技术人员的良师益友;同时也是一本可用于大学高年级或研究生相关课程的教材和参考文献。
-
医学数据仓库与数据挖掘张承江 主编医学数据仓库是数据仓库技术面向医学领域数据的具体实现。与其他企业数据仓库相比,医学数据仓库的数据来源、数据类型和数据特征都有其特殊之处。建立医学数据仓库是医学数据分析处理的基础,是医学信息技术发展的必然,对于医学、医疗卫生、药物学和医学管理等领域的研究与应用都有巨大的推动作用。医学数据挖掘所面临的数据对象类型十分丰富,包括文本、图形、图像等;数据来源也非常广泛。临床医疗和医学研究已积累了大量的信息,如何有效地存储、检索、处理和分析医学数据,为医学决策提供支持,已为医学工作者和信息技术工作者强烈关注。该领域的分析与挖掘技术极富前景,也极具挑战性。本书力图从两个角度观察和分析医学数据处理与分析技术。一方面从信息技术的角度介绍数据仓库及数据分析与挖掘的基本原理、技术和发展前景;另一方面从医学科学的角度介绍医学信息与医学数据以及相关处理技术的特殊性和最新的研究成果。本书可作为医学院校的本科生和研究生教材。也适合于医学领域从事数据处理的专业技术人员阅读。
-
协同演化算法及其在数据挖掘中的应用董红斌,贺志 著演化算法是一种模拟生物演化过程与机制求解优化问题及搜索问题的一类自组织、自适应人工智能技术。协同演化算法是针对传统演化算法的不足而兴起的,通过构造两个或多个种群,建立它们之间的竞争或合作关系,多个种群相互作用来提高各自性能,适应复杂系统的动态演化环境,以达到种群优化的目标。协同演化算法是近年来已成为计算机智能研究的一个热点,已广泛应用于电子工程、模式识别、交通运输规划、经济管理和工程设计优化等领域。本书从协同演化理论和演化算法相结合的角度出发,着重介绍了协同演化算法及其在数据挖掘的应用方面的研究工作。全书共分为10章,内容包括绪论、函数优化、约束优化、多目标优化、兴趣度量优化、数据集的优化和规则形式的简化及演化聚类算法等。本书可作为计算机科学、信息科学、人工智能自动化技术及数据挖掘等相关专业的研究生、教师和科技工作者的参考书。
-
可拓集与可拓数据挖掘蔡文、杨春燕、陈文伟、李兴森可拓数据挖掘以可拓集为集合论基础,结合可拓方法与现有数据挖掘方法去挖掘数据库或数据仓库中基于可拓变换的知识,为经济、金融、管理、营销、策划、医学、设计等领域的决策和技术创新提供依据。本书是第一本可拓数据挖掘的专著,提出了研究这一领域的理论基础、方法体系和应用范围,并给出简单、浅显的实用案例。本书理论与应用相结合,分析透彻。为方便不同知识背景和不同层次读者的学习,书中配备了通俗易懂的案例。 本书适合高等院校师生、工程技术人员和管理决策人员阅读,特别适合作为高等院校相关专业本科、硕士、博士生的选修课教材。
-
数据挖掘理论与应用胡可云等 编《高等学校计算机科学与技术教材·数据挖掘理论与应用》从数据挖掘理论与数据挖掘应用过程两个方面介绍了数据挖掘的最新成果。在理论部分,《高等学校计算机科学与技术教材·数据挖掘理论与应用》介绍了数据挖掘技术所涉及的基本概念、主流技术和最新成果;在应用部分,《高等学校计算机科学与技术教材·数据挖掘理论与应用》结合具体的实例系统论述了商业理解、数据预处理、建模、模型部署等整个数据挖掘流程。《高等学校计算机科学与技术教材·数据挖掘理论与应用》既可以作为大学本科生和研究生的补充教材,也可以作为企业实施数据挖掘和商务智能的实战指导;既可以作为初次接触数据挖掘技术的入门读物,也可以作为高级研究人员的参考书。
-
数据挖掘Clementine应用实务谢邦昌Clementine是SPSS公司整合开发的数据挖掘工具平台。Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。.本书主要介绍了Clementine 11.0在数据挖掘中的应用。内容包括Clementine 11.0的新功能、数据挖掘入门、构建数据流、字段操作节点、建立CLEM表达式、建模节点和生成模型等,详细讨论了各种数据挖掘的分析方法,并介绍了大量的应用范例。本书结构清晰合理,内容翔实,可作为分析师、数据挖掘人员、企业管理人员的参考书。在Kdnuggets网站“你最常用哪种数据挖掘工具”的投票调查中,Clementine连续数年位居第一。它灵活的使用界面,强大的数据预处理以及分析演算功能,能够让分析者在最短的学习周期中,快速上手执行复杂的商业分析。..Clementine作为一套绝佳的数据挖掘软件,从数据收集整理,建立数据库,适当数据挖掘方法、精致报表输出到智能决策的拟定,为用户考虑到每一步骤。从工业数据挖掘,社会调查数据挖掘、生物数据挖掘、财务数据挖掘。教育数据挖掘甚至神经网络,Clementine都有一套适合的配套产品供用户解决相关领域问题。针对业界实务上的需求,本书主要介绍了如下内容:·数据挖掘的入门知识。数据挖掘的应用。数据挖掘在CRM(客户关系管理)中的角色。·SPSS Clementinell.0版本所拥有的所有节点的详细操作指南,包括构建数据流。字段操作节点、建立CLEM表达式,建模节点和生成模型节点等。本书还介绍了SPSS Clementine软件自带的示例数据流的案例讲解,包括:·通过监测一台机器的状态信息来识别和预测故障状态。·农业发展贷款申请中的欺诈探测。·零售行业中,预测促销所带来的影响。·市场购物篮研究。...
-
数据仓库与OLAP实践教程何玉洁数据仓库及联机分析处理是数据库技术发展和应用的一个新阶段,本书全面、详细地介绍了构建数据仓库以及进行多维数据分析的技术,并力求把数据仓库理论以及在该理论领域的相关应用尽可能完美地融合起来,其内容涵盖数据仓库的构建理论、构建示例、前端多维数据的展示及分析技术、对数据仓库及多维数据集的管理和维护等技术。本书以目前流行的Microsoft SQl Server 2000数据库管理系统作为实践平台,以便于读者实践。本书语言通俗易懂,实例丰富。本书非常适合作为计算机、商科及相关专业本科学生学习数据仓库及多维数据分析技术的教材,同时也适合作为研究生数据仓库等课程的教材。
-
数据仓库与数据挖掘原理、工具、及应用潘华,项同德 编著本书为普通高等教育“十一五”规划教材,是电力企业信息化系列教材之一。本书全面深入介绍了数据仓库、联机分析处理(OLAP)和数据挖掘的基本概念、工具及实际应用。全书分成三篇,数据仓库与数据挖掘原理篇的主要内容包括数据仓库的基本概念和结构、创建过程、联机分析处理、数据挖掘的基本概念和方法等;数据仓库与数据挖掘工具篇介绍几个现在市场上主流的数据仓库和数据挖掘工具,包括ETL工具Data Stage、商务智能工具 Congos和数据挖掘工具SAS;数据仓库与数据挖掘应用篇以某电力公司为例介绍一个数据仓库应用系统的建设过程,包括系统需求分析、系统架构设计、数据模型设计、数据库规划、ETL开发等。本书可作为计算机、信息管理与信息系统等相关专业的学生学习数据仓库、OLAP及数据挖掘技术的实用教程,也可供从事数据仓库、数据挖掘研究、设计、开发等工作的科研人员和工程人员参考。
-
高维数据挖掘技术研究杨风召《高维数据挖掘技术研究》从高维数据的特性出发,指出了高维数据给数据挖掘带来的影响以及高维数据挖掘的研究方向。对高维数据挖掘中的相似性搜索、高维数据聚类、高维数据异常检测、高维数据频繁模式发现及电子商务中的协同过滤技术进行了研究,提出了相关的解决方案和相应算法。《高维数据挖掘技术研究》适用于从事数据挖掘和商业智能研究的高校教师、研究生、科研院所的科研人员以及从事商业智能项目开发的工程技术人员。
-
数据仓库与数据挖掘技术陈京民本书介绍了以数据仓库、数据挖掘和联机分析为核心技术的商务智能的基本概念、基本原理、开发方法、开发工具、应用领域和管理方法等内容。 全书共分为10章,包括商务智能基本概念、数据仓库开发模型、数据仓库开发应用过程、联机分析、数据挖掘基本原理和技术、数据挖掘应用工具、电子商务的智能化、商务智能的管理应用,以及商务智能系统的开发应用实例等内容。每章后还附有可供读者自我测试的习题,以帮助读者对全书的理解。本书内容翔实,结构清晰,应用性强,既可以作为高等学校信息管理与信息系统专业、计算机应用专业、自动控制专业以及相关专业本科生和研究生的教材,也可以作为企业、事业单位从事商务智能系统开发应用工作人员的参考用书。