数据库
-
文本数据挖掘宗成庆、夏睿、张家俊文本数据挖掘是通过机器学习、自然语言处理和推理等相关技术或方法,理解、分析和挖掘文本的内 容,从而完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。《文本数据挖掘(第2版)》主 要介绍与文本数据挖掘有关的基本概念、理论模型和实现算法,包括数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分析与观点挖掘、话题检测与跟踪、信息抽取以及文本自动摘要等,后通过 具体实例展示相关技术在实际应用中的使用方法。《文本数据挖掘(第2版)》书可作为高等院校计算机、自动化、网络安全、大数据分析等专业,以及利用到文本信息处理的交 叉学科(如金融财经、社会人文、生物医药等)的高年级本科生或研究生从事相关研究的入门参考书,也可供相关技术研发人员阅读和参考。 -
数据中心低压供配电系统运维叶社文,汪俊宇,兰凡璧 著数据中心低压供配电系统运维以培养实践能力和职业能力为目标,围绕数据中心低压供配电设备的正确维护与保养方法、用电负荷与配电系统的可靠性、各种低压配电系统的方案以及数据中心分级对电源的要求进行了系统论述。 全书共分16章,主要内容包括概述、电工基础知识、电击及现场救护、低压配电系统接地形式、防电击技术、电气防火与防爆、防雷和防静电、常用电气仪表及测量、电工安全用具与安全标志、电工常用工具、低压电器及其成套开关设备、异步电动机、电力电容器、照明装置、电气线路和临时用电等专业知识,并配有常见安全隐患排查和典型事故案例分析。 数据中心低压供配电系统运维注重安全操作技能的培养,严格执行数据中心的用电规范,具有较强的针对性和实用性,是数据中心低压供配电系统从业人员培训考试的必备教材。 -
MongoDB性能调优实战[澳]盖伊·哈里森,[澳]迈克尔·哈里森本书分为以下几个主要部分:第 1-3 章介绍方法和技术。在这些章节中,我们描述了一种性能调优方法。还提供了一些关于 MongoDB 架构和 MongoDB 提供的用于调查、监控和诊断 MongoDB 性能的工具的背景知识。第 4 章和第 5 章介绍应用程序和数据库设计。第 6-10 章介绍应用程序代码的优化。第 11-14 章讨论MongoDB 服务器及其运行硬件的优化。 -
数据中心基础设施运维管理郑学美,郑玥,叶夏 著数据中心基础设施运维管理(基础篇)以培养合格的数据中心基础设施运维管理人才为目标,围绕与数据中心相关的国家政策 及解读、数据中心基础设施的基本组成、数据中心基础设施运维管理人才需求分析、数据中心安全管理及各项规章制度、数据中心相关认证等进行了系统论述。 全书共分5章,第1章介绍了国内数据中心的发展情况、数据中心定义以及数据中心运维人员严重短缺的严峻形势;第2章介绍了数据中心基础设施的组成及功能;第3章介绍了数据中心基础设施运维管理所需人才的技能要求及岗位职责;第4章介绍了数据中心相关安全管理及各项规章制度,为学习者提供了安全管理方面的模板;第5章介绍了数据中心相关认证、认证流程和所需材料。 数据中心基础设施运维管理(基础篇)可作为应用型本科、高职、中专院校数据中心基础设施运维管理等相关专业的教学用书,也可作为成人教育以及在职人员的培训教材和自学读物。 -
Kafka权威指南[美] 格温·沙皮拉,[美] 托德·帕利诺本书介绍Kafka的技术原理和应用技巧。内容包括如何安装和配置Kafka、如何使用Kafka API、Kafka的设计原则和可靠性保证,以及Kafka的一些架构细节,如复制协议、控制器和存储层。本书列举了一些非常流行的Kafka应用场景,比如基于事件驱动的微服务系统的消息总线、流式处理应用程序和大规模数据管道。通过学习本书,你不仅能够深入理解这项大数据核心技术,还能够将所学知识付诸实践,在生产环境中更好地运行Kafka,并基于它构建稳健的高性能应用程序。 -
大数据技术实战案例教程徐鲁辉暂缺简介... -
数据库原理及应用赵军民本书使用深入浅出、通俗易懂的语言介绍数据库系统的基本原理、技术和方法,并结合典型案例,将理论知识融入实践内容,通过实践验证理论,帮助读者掌握数据库相关知识与技术。全书共9章,全面系统地阐述数据库原理与应用,主要内容包括数据库系统概述、关系数据库、关系数据库标准语言、关系数据库规范化理论、数据库设计、数据库的安全性控制与完整性控制、并发控制、数据库备份与恢复和SQL Server 2019 应用。本书以SQL Server 2019为平台介绍数据库技术的实现,主要包括数据库创建与维护、数据表创建与维护、查询与统计操作、视图创建与维护、存储过程和触发器的创建、用户管理与权限分配、数据库备份与恢复等内容,使读者能够通过SQL Server 2019实现教学案例,理论与实践紧密结合,进一步加深对数据库系统基本原理、技术和方法的理解。 -
ClickHouse性能之巅陈峰 著这是一本通过分析ClickHouse底层引擎架构来解读ClickHouse极致性能的底层逻辑的著作,同时还总结了ClickHouse在各种适用场景中的使用技巧和性能调优方法,让读者知其然,也能知其所以然。全书一共12章,分为两个部分:第1部分 架构篇(第1-7章)简要地介绍了数据仓库的核心技术和思路,系统讲解了ClickHouse的查询性能优势、适用场景、架构设计和运作过程,深入地剖析了ClickHouse的存储引擎架构、计算引擎架构以及决定ClickHouse性能的关键因素,还将ClickHouse与其他数仓架构进行了深度对比,不仅阐明了ClickHouse查询速度快的底层逻辑,也推导出了ClickHouse的适用场景。第2部分 实战篇(第8-12章)针对ClickHouse的适用场景,讲解了它的各种使用技巧以及存算分离架构、分布式架构等云计算时代的全新架构,更重要的是,从数据结构、内存、磁盘、网络、CPU、查询等方面全面总结了ClickHouse的性能优化方法和原则。 -
数据分析的结构化表征学习张正,徐勇,卢光明 著结构化表征学习是机器学习研究的核心问题之一,旨在探索如何从高维可观测数据中获取有效的结构化信息表示,以实现高精度、鲁棒、快速的数据分析,是由数据到知识的关键渠道。本书重点介绍如何从具有不确定性的海量大媒体数据中挖掘和提取结构化、鲁棒、高效的特征,并实现高性能的信息挖掘和知识推断。本书内容包含近年来涌现的一些高效、鲁棒的结构化表征学习模型,介绍了基于鲁棒且紧凑的表征学习的一体化表征学习理论和方法,并为应对真实世界中的数据分析任务,如数据简约特征表达、紧凑特征压缩、有效特征筛选以及隐含知识挖掘等,提供了较为全面且切实可靠的解决方案。本书作者所在的团队多年来一直从事机器学习、计算机视觉、多媒体分析的研究,承担过众多***和省部级科研项目,具备从理论研究到工程应用的相关基础。本书是对作者近五年研究成果的总结和梳理,书中介绍的理论和方法能够很好地和实际应用结合在一起,行文流畅易读,适合具有一定专业基础的高年级本科生、研究生,以及相关领域的科研工作者和工程师阅读。 -
Hadoop大数据分析技术迟殿委 陈鹏程伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop 3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。 本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。 本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。
