数据库
-
Apache ShardingSphere实战郑天民 著本书分为9章,主要介绍应用ShardingSphere实现分库分表的一些方法论和工程实践。通过对ShardingSphere的基本概念、应用方式和整体架构的介绍,帮助读者掌握ShardingSphere的设计思想和解决方案;然后从Sharding-JDBC和Sharding-Proxy两款核心组件出发,对分库分表、读写分离、分布式事务、数据脱敏、编排治理及代理服务器等核心功能进行详细阐述,并结合具体场景给出实例分析和实现过程。 本书面向Java服务器端开发人员,读者不需要有很深的技术水平,也不需要详细了解分库分表相关工具,但如果读者熟悉Java EE常见技术并掌握一定数据访问基本概念,则有助于读者更好地理解书中的内容。通过学习本书内容,读者将对ShardingSphere的基本架构、设计思想和应用方式有更加深入的了解,为后续的工作和学习奠定基础。同时,本书可以作为具备不同技术体系的开发人员的参考用书。希望本书能给读者的日常研发和管理工作带来启发和帮助。 -
数据可视化骆岩林 著这是一本以案例为基础、涉及数据可视化相关知识内容讲解的案例教程,具有一定代表性、前沿性和创新性。既可以用于教师教学,也可以用于学生自学,既是教本又是学本。本书共有五个创新案例,包括:多维视(多维非空间数据可视化)、社网视(社交网络关系数据可视化)、脑网视(脑网络可视化)、体视(体数据可视化)、体交互(体数据交互)等系统。多维视、社网视侧重信息可视化,脑网视、体视侧重科学可视化,而体交互涉及可视化中的交互技术。引导学习者通过典型案例的知识点导读、方法概要、系统介绍与配置、导图操作等内容,学习不同的可视化技术。 -
数据库原理与技术华为技术有限公司 著随着近年来互联网+、大数据、AI和数据挖掘等技术的不断发展,数据库技术和产品日新月异,云端数据库已经成为一种重要的数据库类型。本书分8章来介绍数据库技术,内容包括数据库的发展史、数据库基础知识、SQL语法入门、SQL语法分类、数据库安全基础、数据库开发环境、数据库设计基础和华为云端数据库产品GaussDB数据库的使用。本书可作为高校数据库课程的教材,同时也适合作为HCIA-GaussDB V1.5认证考试的参考书。 -
Hadoop大数据开发技术申时全,陈强,杨胜利,黎学军,姜荣正 ... 著本书较为全面地介绍了大数据开发技术平台Hadoop及其生态系统的相关知识。全书共12章,包括Hadoop概述、大数据开发平台Hadoop环境的搭建、Hadoop通用命令与编程原理、Hadoop分布式文件存储HDFS、作业调度与集群资源管理框架YARN、Hadoop分布式计算框架MapReduce、Hadoop数据库HBase、Hadoop数据仓库Hive、Hadoop数据的快速通用计算引擎Spark,以及大数据应用开发综合实例。本书从应用角度出发,重点培养学生应用大数据技术平台Hadoop解决实际问题的能力。 本书内容新颖,简明易懂,可操作性强,可作为普通高等学校、高职高专院校数据科学与大数据、软件工程等计算机相关专业和信息管理类专业“大数据开发技术”课程的教材,也可作为大数据技术培训的教材,还适合大数据技术研发人员和广大计算机爱好者自学使用。 -
并行离群数据挖掘及应用李俊丽 著全书共由7章组成,其中:第1章主要介绍数据挖掘技术、离群挖掘、集群系统与Spark并行计算模型及大数据的相关概念、理论基础和应用。第2章利用特征分组,针对高维分类数据集,研究了一种基于加权特征分组的离群检测新方法,通过将特征分为多个特征组来发现每个组中特征模式的不同方面。第3章利用Spark计算平台,研究了高维分类数据的并行离群检测算法。第4章通过分析属性间的相关性,研究了一种基于互信息的混合属性离群检测算法。该算法在互信息机制下给出了针对数值型和分类型统一的属性加权方法和离群得分计算方法,而且不同类型属性下的相似性度量也进行了规范化处理。第5章针对互信息计算的复杂性问题,充分利用Spark并行计算框架的强大计算能力,研究了一种并行互信息计算方法,该算法利用列变换和虚拟数据划分技术降低了网络传输和计算代价。第6章以某钢铁企业实际的冷轧辊产品加工数据为背景,设计与实现了冷轧辊制造过程离群检测原型系统,从而为企业开展产品质量控制提供了一种新的技术方法和解决思路。第7章是研究的总结与展望。 -
区块链赋能物联网应用关键技术研究乔蕊 著构建基于区块链的高效、安全的分布式物联网网络,对于提高物联网系统协作效率、降低物联网体系运转成本、推动物联网产业技术创新和应用落地具有重要意义。近年来,在区块链应用方面的研究已经取得了一些有价值的成果,然而,到目前为止,基于区块链的物联网系统性能依然存在瓶颈,链上数据的可靠性无法保证,跨链通信状态机同步仍非常困难,距离实际应用需求还存在很大差距。《区块链赋能物联网应用关键技术研究》针对物联网联盟链动态数据存储与共享面临的安全及扩容问题,提出解决方案,可以在确保数据安全性和可靠性的前提下,实现物联网联盟链结点自主跨链交互,为防止物联网数据被篡改、伪造,同时提高系统共识效率与可扩容性提供了一套有效的理论与技术方案。通过理论分析与实验,验证了《区块链赋能物联网应用关键技术研究》所提方法的有效性。 -
Kettle构建Hadoop ETL系统实践王雪迎 著Kettle是一款国外开源的ETL工具,纯Java编写,无须安装,功能完备,数据抽取高效稳定。 本书介绍并演示如何用Kettle完成Hadoop数据仓库上的ETL过程,所有的描绘场景与实验环境都是基于Linux操作系统的虚拟机。全书共分10章,主要内容包括ETL与Kettle的基本概念、Kettle安装与配置、Kettle对Hadoop的支持、建立ETL示例模型、数据转换与装载、定期自动执行ETL作业、维度表技术、事实表技术,以及Kettle并行、集群与分区技术。 本书既适合大数据分析系统开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,也适合高等院校和培训机构人工智能与大数据相关专业的师生参考。 -
PostgreSQL技术内幕张树杰 著事务是关系型数据库实现的核心内容,它具有原子性、一致性、隔离性和持久性等特点,是数据库实现并发控制和故障恢复的基础。 本书首先分析了PostgreSQL数据库事务的实现机制,包括事务的基本概念、两阶段锁的原理及实现方法、多版本并发控制的原理及实现方法、故障恢复的实现方法等,然后通过介绍物理复制、逻辑复制、Zheap引擎的原理及实现、SSI的实现、两阶段提交的原理及实现,使读者获得了对事务更深入的理解,从而使读者既能了解事务的原理,也能清楚事务的实现细节。 本书适合数据库内核开发及相关领域的研究人员、数据库DBA、高等院校相关专业的本科生或者研究生阅读。 -
华为openGauss开源数据库实战中国产业发展研究院 著本书是一本指导读者快速步入华为openGauss开源数据库世界的实战指导书。本书以循序渐进的方式,帮助读者一步一步地轻松掌握openGauss开源数据库。有了这些基础,读者可以更好地学习其他数据库管理系统。 本书由30个实战任务构成:前三个任务是搭建openGauss数据库的实验环境;任务四是openGauss的简单维护;任务五是准备测试数据集;任务六是学习使用openGauss DBMS的客户端工具gsql;任务七到任务二十七则涵盖了openGauss DBMS的方方面面;任务二十八和任务二十九是关系数据库设计的实战;任务三十是搭建openGauss主备数据库以及主备数据库的管理。 本书可以作为openGauss初学者、计算机专业学生学习数据库系统原理与应用的实战指导书,对从事数据库工作的工程技术人员、想快速掌握开源数据库PostgreSQL的技术人员也非常有参考价值。 -
Presto权威指南MattFuller 著高性能分布式SQL查询引擎Presto可用于对不同的数据源执行快速的交互式分析。这本实用指南将带你学习如何对Hive、Cassandra、关系数据库或专有数据存储中的数据进行分析。分析师、软件工程师、生产工程师可以从中学习Presto的管理、使用甚至开发。最初由Facebook开发的开源软件Presto如今已被Netflix、Airbnb、LinkedIn、Twitter、Uber和许多其他公司使用。Matt Fuller、Manfred Moser、Martin Traverso向你展示了单个Presto查询如何组合来自多个源头的数据,从而对整个组织进行分析。
