数据库
-
大数据技术及架构图解实战派徐葳本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包含以下内容。.一、数据采集日志数据采集工具(Flume 、Logstash、Filebeat )数据库数据采集工具(离线采集工具——Sqoop、DataX,实时数据采集工具——Canal、Maxwell 网页数据采集工具物联网数据采集工具消息队列中间件.二、数据存储分布式文件存储之HDFSNoSQL数据库之HBaseNoSQL数据库之Redis.三、离线数据计算离线计算引擎MapReduce离线计算引擎Spark.四、实时数据计算实时计算引擎Storm实时计算引擎Spark Streaming新一代实时计算引擎Flink.五、OLAP数据分析 离线OLAP引擎(Hive、Impala、Kylin)实时OLAP引擎(Druid、ClickHouse、Doris).六、全文检索引擎 Lucene SolrElasticsearch.七、分布式任务调度系统AzkabanOoizeDolphinScheduler.八、分布式资源管理 YARN的原理、架构YARN中的资源调度器【实战】配置和使用YARN多资源队列.九 、大数据平台搭建工具 大数据平台工具HDP大数据平台工具CDH大数据平台工具CDP.本书还介绍了多个企业级大数据应用案例(包括海量数据采集、“双十一”数据大屏、海量数据全文搜索系统等)和大数据平台架构案例(包括离线数据仓库架构、实时数据仓库架构、批流一体化数据仓库架构、数据中台架构、直播大数据平台架构、电商大数据平台架构等),可以帮助读者从全局角度理解大数据。.在本书中,技术内容基本上都是从零讲起的,结合原理和架构,以“图解 实战”的形式帮助读者轻松理解复杂的知识。 -
数据准备阮敬 任韬数据的获取方式、数据的形式及其结构纷繁芜杂,如何把数据整理成我们想要的样子呢?本书通过真实案例构建了数据准备过程中的方法与技术体系,并通过Python 3编程实现从数据获取到数据整理的全过程。全书内容包括数据来源、数据类型、数据编码、数据清洗、数据插补、数据配平、数据重构、数据变换、数据缩放和数据归约。为使读者能够快速掌握数据准备的方法与技术,本书的数据文件与程序代码均可下载(见封底二维码)。线上操作平台地址为http://ykt.ai-learning.net。本书既可作为高等院校的数据分析类课程教材,也可作为社会科学领域数据分析的自学用书。从事数据分析与数据管理工作的相关人员,以及用Python解决实际数据分析问题的工程技术和管理人员亦可参考使用。 -
Hadoop与大数据挖掘 第2版王哲 张良均 李国辉 卢军 梁晓阳 著本书基于开源Hadoop生态圈的主流技术,深入浅出地介绍了大数据相关技术的原理、知识点及具体应用,适合教师教学使用和零基础自学者使用。通过本书的学习,读者可以理解大数据相关技术的原理,迅速掌握大数据技术的操作,为后续数据挖掘与分布式计算平台的结合使用打下良好的技术基础。 -
数据要素概论及案例分析何俊,刘燕,邓飞数据要素是新型生产要素之一,因其蕴含着巨大价值,其重要性被提到了新的高度,但其理论体系尚未完全形成,全生命周期各个环节的理论和技术还在不断探索中。《数据要素概论及案例分析》以数据要素知识体系构建和数据要素价值的发掘应用为主线,从理论和行业案例两个方面,对数据要素生命周期涉及的基础理论、概念和方法及数据要素驱动业务发展行业应用案例进行梳理和呈现。基础知识部分包括数据要素的属性、价值、支撑技术,数据要素规范管理、数据确权和交易,以及数据要素市场化配置等内容。行业案例部分从主数据管理实践、数据治理能力提升、数据要素驱动业务创新应用、数据要素催生创新模式四个方面梳理了21个案例,旨在通过多个行业领域的应用案例分析来帮助数据要素相关理论知识的理解和应用。 -
数据库原理与技术张振国本书具有以下特点:(1) 加符合初学者的认识规律,进一步提高了概念讲解的准确性,内容讲解循序渐进,深入浅出,易于读者学习和掌握。(2)紧跟业界相关技术的发展动态,增加了大数据相关概念、技术及应用领域的讲解。(3)在部分章节后面增加了有关的习题和实验,方便任课教师组织相关实验供学生练习。(4)对例题进行精心设计,将所学内容和相关知识点融入相应例题中,使读者能进一步加深对知识点的理解和掌握。(5)采用较新的SQL Server 2012数据库管理系统平台,扩充了相关的 应用知识,使读者能够很容易学会利用SQL Server 2012进行数据库的创建、使用、维护和管理工作,真正做到学以致用。全书内容相互衔接,成为一个逻辑整体。为方便读者学习和教师授课,本书还提供了习题答案。 -
空间张霄雁本书针对当前空间-文本数据的查询与 领域中亟待解决的空间关键字语义近似查询、查询结果典型化分析和多样性兴趣点推荐等问题进行阐述,以多年来在该方面发表的学术论文为基础,对所取得的相关成果进行了详细的分类,对成果的创新性进行详细的总结,内容主要包括:空间-文本数据的查询索引结构,基于CGAN的空间关键字查询语义扩展方法,空间-文本-数值相融合的混合索引结构,查询结果的典型化分析与top-k选取,多样性与个性化兴趣点推荐方法等。 -
数据库管理与开发项目教程杨云 高玉珍本书以SQL Server 2019为平台,从数据库管理和开发的角度出发,介绍数据库应用系统开发技术,内容涵盖开发数据库应用系统所需的基本知识和技术。本书将数据库应用系统开发实例“学生信息管理系统”融入各项目,再把每个项目分解成若干任务,使学生逐步学会创建、管理、开发数据库,并掌握使用T-SQL进行程序设计的编程思想和技术。本书内容由浅入深,通过任务驱动,将理论与实践密切结合,体现了高职和应用型本科教育的特点,也符合初学者认知和掌握计算机技术的规律。本书可作为高职高专院校、应用型本科院校数据库技术与应用课程的教材,也可作为其他类学校学生和自学者的参考用书。 -
Oracle数据库开发实用教程马明环本书是针对零基础读者研发的Oracle数据库开发实用入门教材。该书侧重案例实训,并提供扫码微课来讲解当前热点案例。本书分为17章,内容包括Oracle概述、掌握Oracle管理工具、数据库与数据表、数据表的约束、数据操作语言、SQL查询基础、SQL 查询、常用系统函数、PL/SQL编程基础、视图与索引、游标、触发器、存储过程的创建与使用、事务与锁、表空间与数据文件、数据的导入与导出。 通过热点综合项目开发学生题库管理系统,让读者进一步巩固项目开发经验。本书通过精选热点案例,可以让初学者快速掌握Oracle数据库开发技术。通过微信扫码看视频,可以随时在移动端学习技能对应的视频操作。读者通过综合实战训练营可以检验学习情况, 提供了扫码看答案。 -
Hadoop+Spark大数据分析实战迟殿委本书是Hadoop Spark大数据分析技术入门书,基于Hadoop和Spark两大框架体系的3.2版本,以通俗易懂的方式介绍Hadoop Spark原生态组件的原理、集群搭建、实战操作,以及整个Hadoop生态系统主流的大数据分析技术。 本书共分14章。第1章讲解Hadoop框架及新版本特性,并详细讲解大数据分析环境的搭建工作,包括Linux操作系统的安装、SSH工具使用和配置等;第2章讲解Hadoop伪分布式的安装和开发体验,使读者熟悉Hadoop大数据开发两大核心组件,即HDFS和MapReduce;第3~12章讲解Hadoop生态系统各框架HDFS、MapReduce、输入输出、Hadoop集群配置、高可用集群、HBase、Hive、数据实时处理系统Flume,以及Spark框架数据处理、机器学习等实战技术,并通过实际案例加深对各个框架的理解与应用;第13~14章分别通过影评分析、旅游酒店评价分析实战项目来贯穿大数据分析的完整流程。 本书可以作为大数据分析初学者的入门指导书,也可以作为大数据开发人员的参考手册,同时也适合作为高等院校大数据相关专业的教材或教学参考书。 -
差分隐私统计数据发布吴英杰本书主要阐述数据统计发布中的差分隐私保护模型及其关键算法。全书共8章,主要内容包括差分隐私基础知识、面向任意区间树结构及其扩展背景(考虑区间计数查询分布和异方差加噪)下的差分隐私直方图发布、面向流/连续数据发布的差分隐私保护、差分隐私数据发布方法的误差分析等。 本书主要面向高等学校计算机科学与技术、网络空间安全、管理科学与工程等学科相关专业高年级本科生、研究生以及数据安全隐私保护的研究者。
