数据库理论
-
openGauss数据库开发实战付强 顾磊openGauss数据库是华为公司在多年数据库领域研发经验基础上开发的数据库产品,为企业级场景需求而设计。本书由浅入深地介绍了openGauss数据库的开发过程,主要内容包括openGauss数据库的安装和配置、体系结构和主要运行机制、GUC参数、用户管理和审计、数据类型、表和索引、SQL基础、常用函数、过程化SQL程序设计,以及数据库的备份与恢复等。本书通过实战帮助读者深入理解openGauss数据库的运行机制。本书结构清晰,案例丰富,适合数据库管理员、程序开发人员、系统架构师等阅读。 -
云数据湖[美]鲁克米尼·戈帕兰本书详细介绍了可用于数据处理的表格格式、云产品、框架、存储层,以及如何将这些内容组合在一起,以获得适合自己需求的高性能解决方案。作者在书中提供的决策框架将帮助你明智地决定选择哪种数据湖。本书是大数据领域每个人的书。阅读本书后,你将了解构建云数据湖所需的所有基础知识,并能够以多种方式应用这些知识。本书主要面向数据架构师、数据开发人员和数据运维专业人员,他们希望广泛地了解设置和运营云数据湖的各个方面。 -
基于低维模型的高维数据分析[美]约翰·莱特, 马毅本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。 -
数据流通李晔、刘阳荷、刘心田、张华庆本书从数据流通的背景、基础、场景应用、市场生态体系、机制体制、趋势展望六个方面对数据流通的基础知识与实际应用进行介绍。 综合本书内容可见,第一,本书是理论与实践的结合。以数据和数字经济的基础理论为出发点,再论述数据发挥作用的途径以及具体的实践应用,有助于对数据流通问题的理解。第二,内容覆盖了数据流通的各个环节、多个行业,从技术分析到机制设计。第三,数据流通是快速发展的领域,提供了相对前沿的知识。 读者对象:期望了解数据流通和数字经济的学者、企业从业者、政府工作人员、学生等。 -
基于鲲鹏的分布式图分析算法实战张志威 袁野 曹莉本书全面、系统地介绍了单机和分布式图分析算法的理论基础、框架、实战应用等,侧重理论与实践相结合。在内容组织上,首先,本书整体介绍图分析技术的发展历程和现状,并分析图分析技术面临的挑战。其次,本书系统介绍了以下内容:单机图分析算法的基本原理、常用场景和基础解法;分布式图分析技术的关键步骤解析及调优策略指导;业界经典的大数据平台和主流的分布式开发框架,以及分布式图计算框架的运行机制和任务调度策略;结合工业界软硬件(鲲鹏芯片和鲲鹏BoostKit加速库)对分布式图分析算法进行调优的方法。最后,本书将分布式图分析技术应用于实际场景,帮助读者基于业务场景进行分布式图计算框架选型。本书既可以帮助对大数据图分析算法感兴趣的读者了解典型图分析算法的原理与优化技术,也可以作为华为鲲鹏图分析算法框架下的实践参考书。 -
数据要素化时代的数据治理上海市静安区国际数据管理协会随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇“新理论、新方法和新技术”介绍数业的逻辑及路径、数据治理的闭环管理方法、数据资产价值的呈现、数据治理的共治共享、精益数据治理,以及数据治理的“新四化”。第三篇“新型数据基础设施”详细介绍来自平安人寿、阿里巴巴和镜舟科技3家企业的数据中台产品的创新情况。第四篇“行业数据治理与数据安全治理”首先介绍高校是如何进行数据治理的,然后介绍数据的安全运营和数据质量问题解决之道。第五篇“企业最佳实践”分享中国石化、中电金信和中国联通3家企业在数据要素化过程中积累的经验。本书适合对数据管理、数据治理、数字化转型等相关主题感兴趣的读者阅读,尤其适合从事相关工作的读者参考借鉴。 -
数据库原理与应用邓立国 邓淇文 苏畅 林庆发数据库技术是现代信息科学与技术领域的重要组成部分,是计算机数据处理与信息管理系统的基础。《数据库原理与应用:MySQL8版本》结合MySQL数据库,详细讲解数据库的原理和设计。《数据库原理与应用:MySQL8版本》配套PPT课件、习题与答案、教学大纲、数据库操作实验手册。《数据库原理与应用:MySQL8版本》分为4篇,共22章,内容包括数据库基础知识、关系数据库、关系数据库标准语言SQL、数据库安全、关系查询处理和查询优化、数据库恢复技术、并发控制、MySQL安装和配置、MySQL数据库基本操作、MySQL数据库中的存储引擎和数据类型、MySQL数据库表操作、MySQL索引与视图操作、MySQL触发器操作、MySQL数据操作、MySQL单表与多表数据查询操作、MySQL运算符与常用函数、MySQL存储过程与函数操作、MySQL事务与安全机制、MySQL日志管理与数据库维护、数据库设计、数据库编程、MySQL图书管理系统设计。《数据库原理与应用:MySQL8版本》内容翔实、知识结构合理、语言简洁流畅、案例丰富,适合希望从事数据库系统研究、开发和应用的研究人员和工程技术人员阅读,也可作为高等院校或高职高专院校计算机科学与技术、软件工程、信息技术等专业的数据库课程的教材。 -
企业数据治理那些事段效亮本书在畅销书《企业数据治理那些事》的基础上,进一步聚焦数据治理的两大场景之一—源端数据治理(另一场景是末端数据治理)进行系统介绍,更加匹配数据治理领域的实践场景。全书共 3 篇 12 章内容,19 个实践,全面探讨了企业源端数据治理的方向、策略、总体架构、治理机制、运维管理等内容。本书首先介绍了企业源端数据治理的发展方向,提出了企业源端数据治理的“八步走”策略;然后从项目层面对企业如何进行源端数据治理进行了深入分析,分别对源端数据治理项目的前期准备、项目实施方法论及调研分析、构建数据管理体系、存量数据清洗、完善源端数据交换架构、优化增量数据质量、企业源端数据治理项目的管理,以及源端数据治理项目实施后的数据运维工作、风险管控进行了介绍,并分享了大量源端数据治理项目实践案例。本书主要面向企业源端数据管理人员、企业信息总监、企业中高级管理人员,能够帮助读者系统地掌握企业源端数据治理的策略和方法。 -
分类属性数据深度无监督学习理论及决策应用武森,高晓楠,单志广本书针对分类属性数据无监督数据挖掘任务中的三个关键问题?特征学习、分析过程和结果评价,阐述分类属性数据深度无监督学习理论及决策应用。全书共7章,第1章概述数据驱动决策支持的技术基础、有监督学习和无监督学习两类数据挖掘方法及分类属性数据无监督学习问题;第2章介绍分类属性数据的无监督特征学习、聚类分析和聚类结果评价等相关理论与方法;第3章系统阐述深度无监督特征学习、深度聚类和网络嵌入方法;第4~6章针对分类属性数据提供了包含深度无监督特征学习、深度聚类和聚类内部有效性评价的一整套深度无监督学习解决方案;第7章以人才招聘为实际问题背景,演绎了分类属性数据深度无监督学习方法在决策支持中的应用。 -
数据质量实践手册[美]普拉桑特·苏特卡尔高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证生成的数据可以有效支持高级分析和人工智能。在本书中,您将学习定义和评估数据质量的技术、标准和度量指标,了解如何确保公司的数据收集实践避免常见的陷阱。本书适合数据科学家、数据分析师、商业智能专业人士、首席技术官和数据官,以及对收集和使用高质量数据感兴趣的人士。对于有志成为首席数据官的各位读者,这是一本难得的宝典级书籍!
