读书网 - dushu.com

数据库

数据认责

[美]大卫-普罗特金

本书提供了关于如何在数据治理中建立和运行数据认责工作的适用且可操作的信息和说明，旨在为新任数据专员或数据治理经理提供在数据认责方面所需的知识，以确保其工作有效和高效。本书分为11章，包括：数据认责和数据治理：二者如何结合；了解数据认责的类型；认责管理的角色和职责；实施数据认责；培训业务型数据专员；数据认责实践；数据专员的重要角色；衡量数据认责进度：指标；数据认责成熟度评估；大数据和数据湖认责；基于数据域开展数据治理和认责。本书内容丰富，理论和实践相结合，易读性和可操作性强，可以作为数据质量管理的入门和进阶用书，还可作为数据治理、信息技术、数据分析等领域人员的参考用书，尤其适合对数据认责感兴趣的读者和负责组织以及运行数据认责工作的人员阅读。
原理、优化与架构设计

董菲包光磊王岩广黄偲韡

本书以TiDB数据库为基础介绍分布式数据库的运行原理、性能优化和应用场景架构设计。首先，剖析分布式数据库的运行原理与架构；然后，阐述分布式数据库TiDB在表与索引的设计优化、SQL优化、系统级优化方面的方法论，通过融入多个有代表性的案例，帮助读者将方法论对应到生产实践中；最后，梳理场景选型和架构设计过程中读者应该掌握的主要知识点，并对一些分布式数据库的优势场景进行了详细介绍。本书适合希望了解分布式数据库原理，学习TiDB数据库的开发工程师、数据库管理员和架构师阅读，也可以作为高等学校教师或学生学习分布式数据库的参考教材。
数据结构

俞勇、张铭、陈越、韩文弢

本书是计算机领域本科教育教学改革试点工作（“101计划”）系列教材之一，秉承“发展经典，关注前沿；问题先导，内容溯源；章节灵活，难度适配”原则编写而成。全书共16章，包括绪论，线性表，栈与队列，字符串，树与二叉树，优先级队列，图，图应用，不相交集，内排序，查找与高级查找，外排序，查找与索引，算法基础，高级算法。本书提供配套教学课件、各章知识点教案、各章引入视频、配套实验教材（C、C++、Java、Python等语言实现），以及实践教学平台等教学资源，可作为高等学校计算机类专业本科生“数据结构”课程教材。
数据库内核揭秘

林金河

《数据库内核揭秘：存储引擎的设计与实现》深入探讨数据库存储引擎内部机制，详细阐述存储引擎在数据管理中的核心作用，包括数据的存储、检索和管理方式。《数据库内核揭秘：存储引擎的设计与实现》共分为9章，内容从基础概念到高级技术，逐步深入，旨在为读者提供全面的理解框架。前两章为读者打下坚实的基础，介绍数据库系统的概览以及操作系统和硬件设备的相关知识。接下来的章节按照自底向上的逻辑顺序，深入探讨存储引擎的关键模块。第3章讲解数据在文件系统中的组织和存储方式。第4章聚焦于缓冲池的设计和缓存替换算法。作为存储引擎的核心，索引在本书占据了3章的篇幅（第5~7章），详细介绍哈希表、LSM树和B树家族。第8章讨论数据库系统中的故障恢复问题，重点介绍了ARIES算法及其应用。第9章关注事务的并发控制，包括多种并发控制算法和优化手段，如多版本并发控制（MVCC）。《数据库内核揭秘：存储引擎的设计与实现》提供了宝贵的理论知识和实践指导，帮助读者掌握构建高性能、高可靠性数据库系统的关键技术。它不仅适合数据库开发者和系统架构师，也适合对存储引擎感兴趣的技术爱好者。
社交网络信息传播模型、算法及应用

朱建明

本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等，并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。
openGauss数据库应用教程

姚绍文、涂永茂、邢薇薇

本书为示范性软件学院联盟建设的首批软件工程系列教材之一。本书以实用导向为原则，介绍将openGauss数据库应用于实际项目的方法。全书共分10章，主要内容如下：介绍openGauss数据库、标准SQL技术及应用；以实际业务为例，讲解数据库设计的方法和技巧；分析不同隔离级别下的事务处理与并发控制；以Java和Python为例，介绍openGauss的应用开发；从网络安全等级保护的视角，阐述openGauss数据库的安全配置和实现；描述openGauss的管理及运维技巧，包括备份与恢复技术等；简述openGauss在安全及高性能方面的一些高级特性。本书的特色在于从原理到应用、从基础到高阶的渐进式内容设计；基于SQL的使用，通过实例引导读者深入理解openGauss，实现了理论与实践的有机结合。本书可作为高等学校软件工程及计算机类专业数据库课程的教学用书，也可作为业界人员和自学人员的参考书。
科研活动中的过犹不及效应

岳婷、杨立英

“过犹不及”效应在科研活动中表现为倒U型现象，即结果随影响因素的增加表现出“先升后降”的特征，这给科研政策的制定提出了一定的挑战。现有科学学研究对倒U型现象的研究缺乏系统性和全面性。本书聚焦于科研活动中倒U型现象的形成机制，主要研究内容包括：对科研活动中已发现的倒U型现象及其解释理论进行全面、系统的梳理;构建一套科研生态系统，将科研活动元素有机地组织起来，用于定位可能发生倒U型现象的科研活动元素;借鉴社会系统中倒U型现象的解释，提出科研活动中倒U型现象的形成机制模型，并应用这一模型，甄别出4种新的倒U型现象，为相关科研政策提供证据支撑。
OLAP引擎底层原理与设计实践

高英举许一腾

这是一本从OLAP核心概念出发，以Presto为例，从整体执行流程到不同SQL的执行原理，完整呈现OLAP查询的核心流程和OLAP引擎设计思路，并指导读者形成OLAP引擎设计解决方案的专业技术工具书。本书不仅面向初级读者介绍了OLAP查询的基本原理和Presto使用方法，还从源码级剖析了OLAP引擎核心原理，包括SQL查询解析器、优化器、调度器、执行器等核心组件，并将内容扩展到OLAP引擎的常见高性能优化方案上。全书由浅入深，图文并茂，把晦涩难懂的内容讲解得透彻易懂。本书分为6篇，包括14章。第一篇（第1章和第2章）总体介绍业界常见的OLAP引擎并分析其优劣，讨论OLAP引擎的技术发展趋势及选型方法，介绍Presto背景知识及其使用方法、技巧。第二篇（第3章和第4章）串讲OLAP查询执行的整个过程，并概要性介绍查询解析器、优化器、调度器、执行器等核心模块的工作原理，目的是让读者形成整体认知。第三篇（第5~8章）以例讲理，对多种经典SQL的执行原理进行解析，复杂度从前到后逐章递增，包含了投影变换、过滤、行数限定、排序以及多种聚合场景。第四篇（第9章和第10章）详解分布式查询执行的数据交换机制，涵盖了查询规划、调度、执行的多个阶段等重点内容。第五篇（第11章和第12章）以Presto为例整体介绍流行的OLAP引擎扩展机制——插件体系与连接器。第六篇（第13章和第14章）主要介绍函数的设计原理与开发实战，这部分首先介绍函数注册、解析识别、调用等重要流程，最后从标量函数、聚合函数两方面入手，用多个实际案例介绍高级API（注解框架）的开发方法以及低级API的底层开发方法。
数据挖掘算法实践与案例详解

丁兆云沈大勇徐伟周鋆

数据挖掘算法为大数据与人工智能的核心，掌握数据挖掘各算法的编程实现，有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现，同时，本书以多个经典的数据挖掘赛题为案例，详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现，有助于提升读者面对实际数据问题时灵活运用各类算法能力。
能源大数据

吴杏平

本书共8章，立足于能源大数据领域核心业务，介绍了世界及中国的能源格局及能源转型背景，阐述了大数据技术的基本原理及其在能源领域的规划、预测等应用中开展实践情况，系统阐明能源大数据中心建设关键问题，深入讲解碳核算方法学。同时向读者说明了能源大数据在服务于“双碳”管理、政府治理中起到的关键作用，展示了能源大数据领域的实践成果和经验。