数据库
-
ClickHouse性能之巅陈峰 著这是一本通过分析ClickHouse底层引擎架构来解读ClickHouse极致性能的底层逻辑的著作,同时还总结了ClickHouse在各种适用场景中的使用技巧和性能调优方法,让读者知其然,也能知其所以然。全书一共12章,分为两个部分:第1部分 架构篇(第1-7章)简要地介绍了数据仓库的核心技术和思路,系统讲解了ClickHouse的查询性能优势、适用场景、架构设计和运作过程,深入地剖析了ClickHouse的存储引擎架构、计算引擎架构以及决定ClickHouse性能的关键因素,还将ClickHouse与其他数仓架构进行了深度对比,不仅阐明了ClickHouse查询速度快的底层逻辑,也推导出了ClickHouse的适用场景。第2部分 实战篇(第8-12章)针对ClickHouse的适用场景,讲解了它的各种使用技巧以及存算分离架构、分布式架构等云计算时代的全新架构,更重要的是,从数据结构、内存、磁盘、网络、CPU、查询等方面全面总结了ClickHouse的性能优化方法和原则。 -
Hadoop大数据分析技术迟殿委 陈鹏程伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop 3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。 本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。 本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。 -
MySQL运维进阶指南贺春旸 著本书以构建高性能MySQL服务器为核心,先介绍MySQL 8.0和MariaDB 10.5的新特性,然后以实战为导向,从故障诊断与优化、性能调优、备份与恢复、MySQL高可用集群搭建与管理、MySQL性能与服务监控、SQL自助上线等角度深入讲解了如何管理与维护MySQL服务器。书中内容均是基于笔者多年的实践经验整理而成,对于有代表性的疑难问题,还给出了实用的情景模拟以及解决方案。51CTO官方推荐 MySQL以其轻便、快捷、运营成本低等优点成为一款*受企业欢迎的数据库产品。贺春旸老师在MySQL领域深耕数十年,有着丰富的一线工作经验。日常在51CTO博客更文也是深受读者的喜欢,更是成为MySQL领域不可多得的博客专家。本书是贺春旸老师的又一佳作,他将多年实操经验融入字里行间,让读者能更快速理解并掌握知识点,在面对自己工作中实际问题时,如虎添翼、从容应对! ——51CTO博客(https://blog.51cto.com/) -
Orange教程张祚Orange是一款可视化人工智能工具,适合会用电脑的所有人群,可以轻松完成机器学习的全流程操作,如数据挖掘、数据分析、文本挖掘、网络分析、图像识别、空间格式化等任务。目前 尚无介绍该软件的中文教程。本书首先对Orange软件进行基本介绍,然后讲述Orange“积木”——分析模块,接着介绍Orange“连连看”——数据分析案例, 后对Orange在科学研究中的应用进行展望。 -
Spark大数据实时计算杨力本书从大数据实时计算框架Spark的编程语言Scala入手,第1~4章重点介绍函数式编程语言Scala的基础语法、面向对象编程以及函数式编程等,再通过编程训练案例介绍Scala这门语言的实际开发应用,为读者后面学习Spark框架打下牢固的编程基础。第5~10章重点介绍Spark的安装部署、SparkCore编程、Spark SQL结构化数据处理以及Spark Streaming实时数据处理等,对它们进行详细的剖析和解读。最后,在第11章中通过网站运营指标统计和IP经纬度热力图分析两个实战开发项目,让读者充分掌握Spark大数据实时计算框架技术的应用与实操方法。本书适合所有对大数据技术感兴趣的读者。 -
大数据分析研究进展周志华,张敏灵,巫英才,瞿裕忠,姜育刚大数据是推动创新型国家建设的重要战略资源。《大数据分析研究进展》从机器学习、可视分析、知识处理、数据挖掘等角度出发,详细讨论了大数据分析的相关基础理论和技术方法,主要包括:大数据机器学习理论与方法,大数据可视分析理论与方法,多源不确定数据挖掘方法与技术,自动深层化知识处理方法与技术,大数据分析平台、标准与应用示范等。《大数据分析研究进展》总结了部分代表性工作,并呈现给读者。 -
k-均值问题的近似算法张冬梅、李敏、徐大川k-均值问题是经典组合优化问题, 也是著名的NP-难问题之一, 相应的Lloyd算法是数据挖掘的 十大经典算法之一. k-均值问题在人工智能、数据挖掘、理论计算机科学、运筹学和管理科学中有 着广泛的应用. 本书介绍k-均值问题及其变形的基于随机抽样、降维、核心集、近似质心集、局部 搜索、线性规划舍入等技术的近似算法. 主要内容包括: 经典k-均值问题的近似算法, k-中位, 球面 k-均值, 鲁棒k-均值, 带约束的k-均值, 隐私保护k-均值, k-均值的其他变形等. -
数据中心UPS系统运维陶亚雄、汪俊宇、高善勃数据中心UPS系统运维在介绍UPS基本知识的基础上,着重介绍了当前数据中心主要使用的双变换在线式UPS的电路组成和工作原理,重点讨论了蓄电池配置的计算方法和UPS针对不同负载的选型计算方法,尤其对数据中心UPS配电系统供电方案、UPS的操作方法以及UPS主机和蓄电池组的巡检及维护方法进行了重点介绍。 数据中心UPS系统运维力求理论和实践相结合,书中所列UPS供电方案及运维保养方法普遍适用于当前主流的数据中心UPS供电系统。数据中心UPS系统运维是关于数据中心UPS运维工作流程的指导性教材,对数据中心UPS运维管理从业人员大有裨益。 -
基于鲲鹏的大数据挖掘算法实战袁春 刘婧 王工艺 著暂缺简介... -
Redis + MongoDB + HBase赵渝强本书介绍了NoSQL数据库生态圈体系,包括Redis、MongoDB和HBase,内容涉及开发、运维、管理与架构。“第1篇 基于内存的NoSQL数据库”(第1~5章)包括:内存对象缓存技术Memcached、Redis基础、Redis高级特性及原理、Redis集群与高可用和Redis故障诊断与优化。“第2篇 基于文档的NoSQL数据库”(第6~10章)包括:MongoDB基础、操作MongoDB的数据、MongoDB的数据建模、MongoDB的管理和MongoDB的集群。“第3篇 列式存储NoSQL数据库”(第11~15章)包括:HBase基础、部署与操作HBase、HBase原理剖析、HBase的高级特性和监控与优化HBase集群。
