数据库
-
数据中心基础设施运维管理郑学美,郑玥,叶夏 著数据中心基础设施运维管理(基础篇)以培养合格的数据中心基础设施运维管理人才为目标,围绕与数据中心相关的国家政策 及解读、数据中心基础设施的基本组成、数据中心基础设施运维管理人才需求分析、数据中心安全管理及各项规章制度、数据中心相关认证等进行了系统论述。 全书共分5章,第1章介绍了国内数据中心的发展情况、数据中心定义以及数据中心运维人员严重短缺的严峻形势;第2章介绍了数据中心基础设施的组成及功能;第3章介绍了数据中心基础设施运维管理所需人才的技能要求及岗位职责;第4章介绍了数据中心相关安全管理及各项规章制度,为学习者提供了安全管理方面的模板;第5章介绍了数据中心相关认证、认证流程和所需材料。 数据中心基础设施运维管理(基础篇)可作为应用型本科、高职、中专院校数据中心基础设施运维管理等相关专业的教学用书,也可作为成人教育以及在职人员的培训教材和自学读物。
-
Kafka权威指南[美] 格温·沙皮拉,[美] 托德·帕利诺本书介绍Kafka的技术原理和应用技巧。内容包括如何安装和配置Kafka、如何使用Kafka API、Kafka的设计原则和可靠性保证,以及Kafka的一些架构细节,如复制协议、控制器和存储层。本书列举了一些非常流行的Kafka应用场景,比如基于事件驱动的微服务系统的消息总线、流式处理应用程序和大规模数据管道。通过学习本书,你不仅能够深入理解这项大数据核心技术,还能够将所学知识付诸实践,在生产环境中更好地运行Kafka,并基于它构建稳健的高性能应用程序。
-
ClickHouse性能之巅陈峰 著这是一本通过分析ClickHouse底层引擎架构来解读ClickHouse极致性能的底层逻辑的著作,同时还总结了ClickHouse在各种适用场景中的使用技巧和性能调优方法,让读者知其然,也能知其所以然。全书一共12章,分为两个部分:第1部分 架构篇(第1-7章)简要地介绍了数据仓库的核心技术和思路,系统讲解了ClickHouse的查询性能优势、适用场景、架构设计和运作过程,深入地剖析了ClickHouse的存储引擎架构、计算引擎架构以及决定ClickHouse性能的关键因素,还将ClickHouse与其他数仓架构进行了深度对比,不仅阐明了ClickHouse查询速度快的底层逻辑,也推导出了ClickHouse的适用场景。第2部分 实战篇(第8-12章)针对ClickHouse的适用场景,讲解了它的各种使用技巧以及存算分离架构、分布式架构等云计算时代的全新架构,更重要的是,从数据结构、内存、磁盘、网络、CPU、查询等方面全面总结了ClickHouse的性能优化方法和原则。
-
Hadoop大数据分析技术迟殿委 陈鹏程伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop 3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。 本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。 本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。
-
MySQL运维进阶指南贺春旸 著本书以构建高性能MySQL服务器为核心,先介绍MySQL 8.0和MariaDB 10.5的新特性,然后以实战为导向,从故障诊断与优化、性能调优、备份与恢复、MySQL高可用集群搭建与管理、MySQL性能与服务监控、SQL自助上线等角度深入讲解了如何管理与维护MySQL服务器。书中内容均是基于笔者多年的实践经验整理而成,对于有代表性的疑难问题,还给出了实用的情景模拟以及解决方案。51CTO官方推荐 MySQL以其轻便、快捷、运营成本低等优点成为一款*受企业欢迎的数据库产品。贺春旸老师在MySQL领域深耕数十年,有着丰富的一线工作经验。日常在51CTO博客更文也是深受读者的喜欢,更是成为MySQL领域不可多得的博客专家。本书是贺春旸老师的又一佳作,他将多年实操经验融入字里行间,让读者能更快速理解并掌握知识点,在面对自己工作中实际问题时,如虎添翼、从容应对! ——51CTO博客(https://blog.51cto.com/)
-
Spark大数据实时计算杨力本书从大数据实时计算框架Spark的编程语言Scala入手,第1~4章重点介绍函数式编程语言Scala的基础语法、面向对象编程以及函数式编程等,再通过编程训练案例介绍Scala这门语言的实际开发应用,为读者后面学习Spark框架打下牢固的编程基础。第5~10章重点介绍Spark的安装部署、SparkCore编程、Spark SQL结构化数据处理以及Spark Streaming实时数据处理等,对它们进行详细的剖析和解读。最后,在第11章中通过网站运营指标统计和IP经纬度热力图分析两个实战开发项目,让读者充分掌握Spark大数据实时计算框架技术的应用与实操方法。本书适合所有对大数据技术感兴趣的读者。
-
大数据分析研究进展周志华,张敏灵,巫英才,瞿裕忠,姜育刚大数据是推动创新型国家建设的重要战略资源。《大数据分析研究进展》从机器学习、可视分析、知识处理、数据挖掘等角度出发,详细讨论了大数据分析的相关基础理论和技术方法,主要包括:大数据机器学习理论与方法,大数据可视分析理论与方法,多源不确定数据挖掘方法与技术,自动深层化知识处理方法与技术,大数据分析平台、标准与应用示范等。《大数据分析研究进展》总结了部分代表性工作,并呈现给读者。
-
k-均值问题的近似算法张冬梅、李敏、徐大川k-均值问题是经典组合优化问题, 也是著名的NP-难问题之一, 相应的Lloyd算法是数据挖掘的 十大经典算法之一. k-均值问题在人工智能、数据挖掘、理论计算机科学、运筹学和管理科学中有 着广泛的应用. 本书介绍k-均值问题及其变形的基于随机抽样、降维、核心集、近似质心集、局部 搜索、线性规划舍入等技术的近似算法. 主要内容包括: 经典k-均值问题的近似算法, k-中位, 球面 k-均值, 鲁棒k-均值, 带约束的k-均值, 隐私保护k-均值, k-均值的其他变形等.
-
数据中心UPS系统运维陶亚雄、汪俊宇、高善勃数据中心UPS系统运维在介绍UPS基本知识的基础上,着重介绍了当前数据中心主要使用的双变换在线式UPS的电路组成和工作原理,重点讨论了蓄电池配置的计算方法和UPS针对不同负载的选型计算方法,尤其对数据中心UPS配电系统供电方案、UPS的操作方法以及UPS主机和蓄电池组的巡检及维护方法进行了重点介绍。 数据中心UPS系统运维力求理论和实践相结合,书中所列UPS供电方案及运维保养方法普遍适用于当前主流的数据中心UPS供电系统。数据中心UPS系统运维是关于数据中心UPS运维工作流程的指导性教材,对数据中心UPS运维管理从业人员大有裨益。
-
基于鲲鹏的大数据挖掘算法实战袁春 刘婧 王工艺 著暂缺简介...