读书网 - dushu.com

数据库设计/管理

MySQL性能优化和高可用架构实践

宋立桓

互联网公司里面几乎很少有公司不用MySQL，国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙，则性能优化和高可用架构设计实践就是点睛之笔。《MySQL性能优化和高可用架构实践》将详细讲解MySQL5.7高可用和性能优化技术，细致梳理思路，并与真实生产案例相结合，通过原理阐述到实战部署，帮助读者将所学知识点运用到实际工作中。《MySQL性能优化和高可用架构实践》分为13章，详解MySQL5.7数据库体系结构，InnoDB存储引擎，MySQL事务和锁，性能优化，服务器全面优化、性能监控，以及MySQL主从复制、PXC、MHA、MGR、Keepalived+双主复制等高可用集群架构的设计与实践过程，并介绍海量数据分库分表和Mycat中间件的实战操作。《MySQL性能优化和高可用架构实践》既适合有一定基础的MySQL数据库学习者、MySQL数据库开发人员和MySQL数据库管理人员阅读，同时也能作为高等院校和培训学校相关专业师生的参考用书。
openGauss数据库核心技术

李国良，周敏奇

本书系统论述了openGauss数据库理论、技术及应用。本书共11章，首先介绍数据库发展历史，包括传统的网状数据库、层次数据库、关系数据库、NoSQL数据库、NewSQL数据库、云数据库、多模数据库、分布式数据库等。其次介绍结构化查询语言（SQL）、SQL语法、存储过程、触发器、游标、数据库设计规范和E-R 模型等数据库基础知识。再次介绍数据库未来发展趋势，包括新硬件、不同部署形态、新应用对数据库的影响。*后重点介绍 openGauss的核心技术，包括openGauss的核心架构、面向鲲鹏和？N腾等新硬件的优化技术、SQL引擎、执行器技术、数据库存储技术、数据库事务机制、数据库安全、数据库自治技术等。为方便读者掌握数据库教学内容，本书每章都提供了小结和习题（含答案）。通过阅读本书，读者可以深入了解数据库的发展历史与未来趋势、数据库系统架构、鲲鹏和？N腾优化技术、数据库事务处理技术、数据库执行器技术、数据库安全技术，从而既可以在将来开发数据库的核心代码，也可以更好地利用数据库开发应用。本书既可作为高校本科生和研究生学习数据库的参考书，也可作为高等院校、科研机构等相关单位从事数据库理论教学或科学研究的教师、系统实现的研究人员的参考书，还可供企业工程师进行数据库二次开发和应用开发的参考。
架构、规范与SQL技巧

马立和，高振娇，韩锋

SQL是*重要的关系数据库操作语言。SQL语句的运行效率，对于数据库的整体性能至关重要。因此，SQL语句的优化就成为数据库专业人员必须掌握的一门技能。很多初学者经常有如何入门、提高SQL语句优化能力的困惑。本书规避了市面上大多关于SQL优化的书籍内容过于深奥问题，以一线开发工程师的言语和视角展开，理论与实践并重，不仅适合初学者，也适合中端技术人员。本书以大量案例为依托，系统讲解了SQL语句优化的原理、方法及技术要点，尤为注重实践，在章节中引入了大量的案例，便于学习者实践、测试，反复揣摩。全书分为四篇：引言篇，总结了实际工作中常见的问题，并通过真实案例让读者直观感受到SQL语句优化的重要。同时在每个案例后面，还针对案例出现的问题进行了总结；原理篇，主要讲解了和SQL语句优化相关的基础知识及必要的一些操作，包括优化器、成本、执行计划、统计信息、语句解析、游标、绑定变量、数据对象等诸多方面；优化篇，这是本书的重点，详细讲述了优化器对于SQL语句的多种处理方式，包括查询转换、数据对象访问方式、表关联、半/反连接、子查询、排序、并行等等。读者了解了这些方式，可以更好地理解优化器的行为，也就使优化更加有的放矢。这部分实战性极强，读者可以作为案头参考资料，随时查阅，反复实践；实践篇，从数据设计开发规范、数据库画像、SQL优化方法论、AWR报告解读及数据库审核平台实践等几个角度全面讲解在实际工作中如何通过优化SQL，大幅度提高数据库的性能。
数据库系统内幕

（美）亚历克斯·彼得罗夫

本书旨在指导开发者理解现代数据库和存储引擎背后的内部概念，包含从众多书籍、论文、博客和多个开源数据库源代码中精心选取的相关材料。本书深入介绍了数据存储、数据构建块、分布式系统和数据集群，并且指出了现代数据库之间最重要的区别在于决定存储结构和数据分布的子系统。本书分为两部分：第一部分讨论节点本地的进程，并关注数据库系统的核心组件——存储引擎，以及最重要的一个特有元素；第二部分探讨如何将多个节点组织到一个数据库集群中。本书主要面向数据库开发人员，以及使用数据库系统构建软件的人员，如软件开发人员、运维工程师、架构师和工程技术经理。
Apache Spark流处理

Gerard Maas,弗朗索瓦·加里洛

在构建分析工具以快速获得洞察力之前，你首先需要知道如何处理实时数据。熟悉Apache Spark的开发人员通过这本实用指南，可以学习如何将该内存框架用于流数据处理。你会发现Spark（如何让你用与编写批处理作业几乎相同的方式编写流作业。两位作者Gerard Maas和Farancois Garillot将带你探索Apache Spark的理论基础知识。本书通过两个部分对比了Spark（现在支持的两种流API的差异：原始Spark Streaming库和新的结构化流API。学习基本的流处理概念并研究不同的流体系结构通过实例探讨结构化流处理；详细介绍流处理的不同方面。利用Spark流创建和操作流作业和应用程序；将Spark流与其他Spark API集成。学习高级Spark流处理技术，包括近似算法和机器学习算法。将Apache Spark与其他流处理项目进行比较，包括Apache Storm、Apache Flink和Apache Kafka Strearns。
数据科学入门

Joel Grus

想真正学会数据科学，你不仅要掌握工具——数据科学库、框架、模块和工具包——还要理解它们背后的思想和原理。更新的《数据科学入门》第2版为你展示了这些工具和算法是如何从零开始实现的。如果你具备数学能力和一些编程技能，作者Joel Grus将会帮你熟悉数据科学相关的核心数学和统计学知识，以及作为一名数据科学家所需的黑客技巧。这本更新的书还包含了关于深度学习、统计学和自然语言处理的新资料，为你展示了如何在日常繁杂冗余的数据中找到宝石。快速入门Python学习线性代数、统计学和概率的基础知识——以及它们在数据科学中的使用场景收集、探索、清理、管理和操作数据深入研究机器学习的基础知识实现k近邻、朴素贝叶斯、线性回归、逻辑回归、决策树、神经网络和聚类等模型探索推荐系统、自然语言处理、网络分析、MapReduce和数据库知识
Power BI智能数据分析与可视化从入门到精通

牟恩静，李杰臣

随着大数据时代的来临，各种数据分析和可视化软件层出不穷，如何处理并直观展示大数据，成为了很多人都关心的一个话题。虽然应运而生了多个数据可视化工具，但随着微软Power BI软件的推出，并在行业的占有率越来越高，Power BI成为了众多大型企业青睐的数据分析对象。本书是基于Powe BI软件编写的书籍，由浅入深地讲解了Power BI的基础技术知识，就算是零基础的读者也能够快速上手操作。本书还对快速实现数据的智能分析与可视化进行了详细的介绍，并利用多个案例让读者融会贯通。通过本书的学习，您将从过去繁琐的数据处理、报表编制中解脱出来，瞬间做出美观、动态的交互式商业报告，实现公司企业内部数据可视化分析与分享，从而洞察数据的意义，实现管理的价值，大幅提升管理能力、管理水平。
Python Docker实战

（美）萨蒂亚吉斯·马哈

《Python Docker实战》讲述容器和虚拟机之间的重要区别，采用基于项目的方式，指导读者使用Docker来开发和容器化一个简单的Python应用程序。在简要介绍容器和Docker后，《Python Docker实战》将指导读者安装和配置Docker，还通过使用Docker命令运行一个简单容器来呈现Docker中使用的基本函数和命令。此后讲解如何使用所需的库和虚拟环境来开发一个基于Python的消息传递机器人，并将Docker卷添加到项目中，以确保容器数据的安全。《Python Docker实战》最后创建一个数据库容器，将项目链接到该容器，并使用Docker Compose-次性启动与机器人相关的数据库。
Oracle Database 12cR2 In-Memory性能优化实战

（美）乔吉特·班纳吉

《Oracle Database 12cR2 In-Memory性能优化实战》循序渐进地介绍了如何使用Oracle Database 12cR2 In-Memory优化数据库性能，并缩短事务处理时间。该书从Oracle企业架构师视野提出了如何实现高性能的专家建议，以及实际操作说明和实践。《Oracle Database 12cR2 In-Memory性能优化实战》阐述了如何部署软件、构建查询以及在Oracle RAC集群和多租户环境中使用In-Memory，并通过具体案例研究说明如何在实际应用中实施In-Memory。
R统计数据清洗及应用

（荷兰）马克·范德鲁，埃德温·德荣格

■重点关注数据清洗方法的自动化，既包括理论知识，也包括使用R语言编写的应用。 ■使读者能够设计数据清洗过程，用于进行一次性分析或者设置生产系统以便定期进行数据清洗。 ■探索各种统计技术，以便解决诸如不完整、矛盾和离群等方面的问题，更好地进行数据清洗组件的集成和质量监控。 ■图书配套网站提供特征数据和R范例代码。