数据库
-
Apache Spark大数据分析[瑞典]罗伯特·伊利杰森(Robert Ilijason)Azure Databricks是一款基于云的大数据分析和机器学习平台,用于实现基于Apache Spark的数据处理,为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。《Apache Spark大数据分析:基于Azure Databricks云平台》详细介绍基于Azure Databricks云平台来使用Apache Spark完成大规模数据处理和分析的方法。本书总计11章,首先介绍大规模数据分析相关的概念;然后介绍受管的Spark及其与Databricks的关系,以及Databricks的版本差异和使用方法(涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容);接着介绍使用SQL和Python分别实现数据分析的过程,数据提取、变换、加载、存储、优化技巧等高阶数据处理方法以及外部连接工具、生产环境集成等内容;后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。作为数据分析领域的入门书,本书具有很强的实用性,可供数据工程师、数据分析师和决策分析人员等学习和参考。
-
大数据可视化朱敏 甘启宏 邓韩彬 主编本书内容涵盖数据可视化概述、可视化的基础(数据)、可视化任务的概念、如何定义自己的可视化任务、视觉编码设计的理论基础和应用场景、交互和多视图、可视分析、Web数据可视化工具,以及可视化领域常用的可视化图表。本书可作为高校计算机相关专业的高年级本科生及低年级研究生学习数据可视化的入门教材,也可供对数据分析能力有要求的其他专业的学生学习参考,还可作为从事数据科学、数据分析的研究人员和技术人员的参考手册。
-
边缘计算使能工业互联网戴文斌 宋华振 彭瑜本书从工业视角出发,对制造业体系架构与发展过程进行回顾与总结,并在工业互联网的全新架构下,阐述边缘计算给制造业带来的改变。首先详细介绍了在工业互联网 边缘计算的背景下工业软件的模式变革和标准化进程,接着介绍工业边缘计算中所需要的关键技术,包括确定性IP网络、双绞线以太网和先进物理层、OPC UA TSN、DDS等新一代工业通信技术、工业4.0管理壳以及工业边缘计算建模语言IEC 61499,对工业边缘计算的应用场景(包括参数寻优、热备份冗余、预测性维护以及数字孪生等)进行了系统介绍。
-
数据科学[美]希拉格·沙阿(Chirag Shah)本书以实用和可接受的方式详细介绍了数据科学领域,强调动手实践。独立于技术介绍数据科学的基本思想和相关技术,允许学生在没有强大的技术背景的情况下轻松地发展对该主题的坚定理解,并提供即使在工具和技术发生变化后仍然具有持续相关性的材料。使用流行的数据科学工具,如Python和R,这本书提供了许多实际应用的例子,实践范围从小数据到大数据。为教师和学生提供的一套在线材料,包括数据集、PPT、解决方案和课程建议等。
-
数据中心高压供配电系统运维汪俊宇、叶社文、禚思齐本书结合了作者多年的数据中心实际工作经验,根据高压运维技术人员上岗的基本要求,围绕数据 中心供配电系统的电力知识和高压系统的操作特点,由浅入深地全面讲述了高压电气设备操作的安全要 求,对高压巡视、操作等项目做了详细的图文解释。全书共分13章,包括安全生产管理、电力系统基 本概念、电力变压器、互感器、高压电气、高压成套配电装置、高压电力线路、过电压保护与接地装置、 继电保护与二次回路、变配电站安全保障、高压开关柜的倒闸操作、变配电站运行管理、高压安全用具等。 本书的编写以理论知识和原理讲解“实用、够用”为原则,以职业岗位的需求和生产实际为主线, 采用理论与实践相结合的教学模式,向读者讲授供配电领域数据中心的新设备和新技术。本书内容深入 浅出、循序渐进,技能训练内容的设计贴近生产实际,力求在有限的篇幅内使读者把握实践操作要领, 帮助读者理解并记忆所学的专业知识,**限度地提升读者的专业技能,为读者终身职业生涯的发展搭 建平台。 本书详细介绍了各类型高压电气的安全知识、操作技巧和运维经验,读者可以全面、快速地掌握数 据中心高压运维的各项作业技巧和本领。本书可作为高职高专院校电气自动化技术、供配电技术、建筑 电气工程技术和农村电气化技术等相关专业的教学用书,也可供从事供配电运行、管理工作的工程技术 人员参考使用。
-
基于大数据的经济形势监测预测理论与方法田茂再该专著的研究内容涉及到两方面:一是“大数据经济形势监测理论与方法研究”;二是“经济大数据统计分析理论、方法重构研究”。 前者主要研究内容包括:经济大数据数据源与指标采集;大数据经济形势监测;大数据经济形势预测;大数据经济形势预警和大数据政策模拟这五个部分;后者主要研究内容包括:致力于解决大数据时代下经济统计学基本理论框架的重新构建以及这些理论与其他学科交叉应用研究等一系列的重大理论与应用问题,这些国际前沿研究主要内容包括:经济大数据统计学基本理论的发展研究;以及经济大数据统计学基本理论的应用。
-
ClickHouse入门、实战与进阶陈光剑 著本书是ClickHouse领域的集大成之作,从基础知识、实现原理、项目实战、扩展应用4个维度全面展开,表述简练清晰、案例丰富实用,既可以作为入门的标准参考书,又适合作为案头速查手册。书中内容是作者在阿里巴巴、字节跳动多年实战经验的总结,得到了字节跳动和阿里巴巴9位大数据专家的高度评价。全书共10章,主要内容如下:第1~3章整体介绍ClickHouse概念、特性、应用场景、技术生态、快速入门和基础数据类型等基础内容,目的是从本质上揭开ClickHouse高性能背后的秘密,帮助读者快速上手实践。第4~6章重点讲解ClickHouse的高级数据类型、函数和SQL查询语法与配置实践等进阶内容,通过该部分内容的阅读和学习,你将全面掌握ClickHouse核心功能的使用方法和技巧。第7~10章从企业级项目实战的角度出发,详细解析ClickHouse在实际业务项目中的使用,主要包括基于Spring Boot开发ClickHouse SQL查询工具、基于ClickHouse Bitmap实现DMP用户画像标签圈选人、基于ZooKeeper搭建ClickHouse分布式集群、基于Grafana搭建ClickHouse集群监监控平台等相关内容。通过该部分内容的阅读学习,你将掌握ClickHouse企业级项目实战开发的方方面面。本书非常注重实用性和实战性,不仅在各个知识点都辅有大量的实际案例、图表说明和小贴士,而且还有多个综合性的项目案例贯穿全书。
-
Zeek实战高勇本书深入介绍流量安全分析工具Zeek,内容涵盖环境搭建、工具安装、基础应用和Zeek脚本编程等多个方面。同时,本书还结合网络安全工作中的实际需求向读者展示以Zeek为基础快速搭建一套相对完整的流量分析体系的过程。 全书共分3部分: 第1部分(第1章)着重介绍网络流量分析在网络安全工作中的重要意义,以及一个完整流量分析体系的大致框架;第2部分(第2~5章)为基础篇,着重介绍Zeek的基本功能及使用方法,并在第5章中通过6个示例向读者展示Zeek在实际场景中的运用;第3部分(第6~8章)为进阶篇,重点介绍使用Zeek时需要了解的脚本编程内容及相关功能框架,并在第8章中通过示例向读者展示如何将一个流量分析目标终落地成可运行的Zeek脚本。 本书适合作为信息安全从业人员、流量分析相关工作者的工具书,同时可供对Zeek或流量分析领域感兴趣的开发人员、广大科技工作者和研究人员参考。
-
Spark入门与大数据分析实战迟殿委 李超《Spark入门与大数据分析实战》基于Spark 3.3.1框架展开,系统介绍Spark生态系统各组件的操作,以及相应的大数据分析方法。《Spark入门与大数据分析实战》各章节均提供丰富的示例及其详细的操作步骤,并配套示例源码、PPT课件和教学大纲。《Spark入门与大数据分析实战》共分11章,内容包括Scala编程基础、Spark框架全生态体验、Spark RDD、Spark SQL、Kafka、Spark Streaming、Spark ML、Spark GraphX、Redis等技术框架和应用,并通过广告点击实时大数据分析和电影影评大数据分析两个综合项目进行实战提升。《Spark入门与大数据分析实战》适合Spark框架初学者,既可以作为大数据分析技术、大数据应用开发工程师的查询手册,也可以作为高等院校或高职高专计算机技术、软件工程、数据科学与大数据科学、智能科学与技术、人工智能等专业大数据课程的教材。
-
GeoMesa时空数据管理刘钧文、梁超、俞自生这是一本专门为智慧城市开发和管理人员打造的GeoMesa学习图书。本书的重点不仅包括宏观的行业环境,还包括对GeoMesa内部原理的剖析,力图帮助读者搭建GeoMesa以及时空数据高效管理的完整知识体系和技能树。本书首先从GeoMesa的历史及上手教程入手。然后,为了加强读者对入门代码中内容的理解,本书对GeoTools的基本概念进行介绍。接着,为了进一步引导读者对时空数据管理建立认知,本书详细阐述GeoMesa核心的时空索引。除了理论方面的介绍,本书还介绍GeoMesa数据写入、数据查询、数据统计、数据分析、数据工作流以及数据存储方案的使用方法和原理,以及GeoMesa对分布式计算的扩展。后,作者针对实际操作时遇到的典型问题,给出详细的解决方案。