数据库
-
数据质量实践手册[美]普拉桑特·苏特卡尔高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证生成的数据可以有效支持高级分析和人工智能。在本书中,您将学习定义和评估数据质量的技术、标准和度量指标,了解如何确保公司的数据收集实践避免常见的陷阱。本书适合数据科学家、数据分析师、商业智能专业人士、首席技术官和数据官,以及对收集和使用高质量数据感兴趣的人士。对于有志成为首席数据官的各位读者,这是一本难得的宝典级书籍! -
分类属性数据深度无监督学习理论及决策应用武森,高晓楠,单志广本书针对分类属性数据无监督数据挖掘任务中的三个关键问题?特征学习、分析过程和结果评价,阐述分类属性数据深度无监督学习理论及决策应用。全书共7章,第1章概述数据驱动决策支持的技术基础、有监督学习和无监督学习两类数据挖掘方法及分类属性数据无监督学习问题;第2章介绍分类属性数据的无监督特征学习、聚类分析和聚类结果评价等相关理论与方法;第3章系统阐述深度无监督特征学习、深度聚类和网络嵌入方法;第4~6章针对分类属性数据提供了包含深度无监督特征学习、深度聚类和聚类内部有效性评价的一整套深度无监督学习解决方案;第7章以人才招聘为实际问题背景,演绎了分类属性数据深度无监督学习方法在决策支持中的应用。 -
企业数据治理那些事段效亮本书在畅销书《企业数据治理那些事》的基础上,进一步聚焦数据治理的两大场景之一—源端数据治理(另一场景是末端数据治理)进行系统介绍,更加匹配数据治理领域的实践场景。全书共 3 篇 12 章内容,19 个实践,全面探讨了企业源端数据治理的方向、策略、总体架构、治理机制、运维管理等内容。本书首先介绍了企业源端数据治理的发展方向,提出了企业源端数据治理的“八步走”策略;然后从项目层面对企业如何进行源端数据治理进行了深入分析,分别对源端数据治理项目的前期准备、项目实施方法论及调研分析、构建数据管理体系、存量数据清洗、完善源端数据交换架构、优化增量数据质量、企业源端数据治理项目的管理,以及源端数据治理项目实施后的数据运维工作、风险管控进行了介绍,并分享了大量源端数据治理项目实践案例。本书主要面向企业源端数据管理人员、企业信息总监、企业中高级管理人员,能够帮助读者系统地掌握企业源端数据治理的策略和方法。 -
数据库原理与应用邓立国 邓淇文 苏畅 林庆发数据库技术是现代信息科学与技术领域的重要组成部分,是计算机数据处理与信息管理系统的基础。《数据库原理与应用:MySQL8版本》结合MySQL数据库,详细讲解数据库的原理和设计。《数据库原理与应用:MySQL8版本》配套PPT课件、习题与答案、教学大纲、数据库操作实验手册。《数据库原理与应用:MySQL8版本》分为4篇,共22章,内容包括数据库基础知识、关系数据库、关系数据库标准语言SQL、数据库安全、关系查询处理和查询优化、数据库恢复技术、并发控制、MySQL安装和配置、MySQL数据库基本操作、MySQL数据库中的存储引擎和数据类型、MySQL数据库表操作、MySQL索引与视图操作、MySQL触发器操作、MySQL数据操作、MySQL单表与多表数据查询操作、MySQL运算符与常用函数、MySQL存储过程与函数操作、MySQL事务与安全机制、MySQL日志管理与数据库维护、数据库设计、数据库编程、MySQL图书管理系统设计。《数据库原理与应用:MySQL8版本》内容翔实、知识结构合理、语言简洁流畅、案例丰富,适合希望从事数据库系统研究、开发和应用的研究人员和工程技术人员阅读,也可作为高等院校或高职高专院校计算机科学与技术、软件工程、信息技术等专业的数据库课程的教材。 -
数据质量管理实践手册[英]罗伯特·霍克(Robert Hawker)本书深入剖析了组织中数据质量的重要性及提升方法,为组织打造优质数据提供了全面的指导。书中首先揭示了糟糕的数据质量对企业流程、决策及合规的潜在影响,进而阐述了提高数据质量的核心要素和端到端的实践流程。详细解析了数据质量提升方案的每个步骤,从构建业务案例到管理初期的繁忙阶段,再到确定关键利益相关者并明确数据规则,为读者提供了清晰的操作路径。此外,书中还介绍了数据监控与修正的有效方法,并探讨了如何将良好的数据实践融入企业日常运营。最后,作者总结了一份提升数据质量的完整纲要,配以实例和模板工具,以点燃读者的探索热情,并助力数据质量工作持续高效推进。本书是企业数据质量管理的指南,适合各类组织的数据从业者和管理者阅读参考。 -
数据指标体系李渝方这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影响,旨在帮助读者深入理解数据指标与实际业务的底层关联,把数据指标体系落地到业务中。第一篇(第1章):深度解读数据指标体系的基础知识,让读者充分理解数据指标,并掌握构建策略、全流程和方法概要,其中包括数据指标体系分类标准、评判优质指标的4个标准、选择数据指标的4个注意事项、数据指标体系3要素、构建指标体系的7个策略等重点。第二篇(第2~6章):从实践层面出发,带领读者基于业务目标一步步提炼5类产品(工具类、内容类、社交类、交易类、游戏类)的关键数据指标,并通过精细的维度拆解,呈现清晰的指标规划图谱。本篇还在最后站在分析维度的角度给出了数据指标分析的方法论。第三篇(第7章和第8章):在第二篇形成的规划图谱的基础上,给出数据指标构建的完整方法论,并以在线教育、电子书阅读工具、图文内容社区、网约车平台、社交电商这五大典型行业为例,完整解读如何将方法论应用于实践。第四篇(第9章和第10章):揭秘数据从埋点收集到清洗加工的全过程,包括原始数据采集、数据处理与指标开发、数仓模型构建等。这是实现高效数据处理的关键,也是数据分析师技能之一。第五篇(第11章和第12章):通过实际案例指导读者搭建数据指标体系,并展示如何利用数据指标体系监控业务动态,分析数据异动,量化其对整体业务的影响。其中包括25种BI数据可视化方法、2个监控看板实战案例、精准定位数据异动的方法、4种数据异动类型、1套异动维度拆解策略,以及7种量化数据异动贡献度的方法。 -
原理、架构和代码分析王凤刚在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的“全景图”。本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者和学者,也可作为高校计算机类专业的分布式数据库相关课程的参考资料。 -
异构制造大数据智能融合技术及应用姚雪梅本书是一部异构制造大数据智能融合技术的学术专著。本书以制造业大数据为背景,围绕旋转设备的运行状态展开,系统介绍了在多源异构制造大数据的基础上利用多源数据融合的方法实现旋转设备的运行状态监测和智能诊断。本书的最大亮点和特色是遵循理论性与实践性相结合、先进性与实用性相结合、专业性与通用性相结合的原则。本书适合以下读者: 对人工智能、机器学习、数据融合感兴趣的读者;希望用计算机的算法解决机械相关领域问题的研究者、工程设计人员和应用人员。本书可以作为计算机专业和机械专业的本科毕业设计和研究生学术论文的参考资料,尤其是可供研究多源数据融合和机械设备故障诊断方向的学生、研究人员参考;还可以作为相关工程技术人员的辅助参考。 -
ChatGPT数据分析实践史浩然、赵辛、吴志成本书从ChatGPT的基础原理讲起,逐步深入ChatGPT的基础使用和插件功能,并结合各种数据分析实战案例,重点介绍了ChatGPT在各种数据分析场景中的应用方法,让读者不但可以系统地学习ChatGPT相关知识,而且能对ChatGPT在数据分析中的实战应用有更为深入的理解。本书分为12章,涵盖的主要内容有:ChatGPT简介与基本原理;ChatGPT使用方法;ChatGPT插件应用;ChatGPT构建指标体系、ChatGPT 数据采集与清洗、ChatGPT探索性数据分析和可视化、ChatGPT推断性统计分析、ChatGPT预测分析、ChatGPT文本分析、ChatGPT分类和聚类分析、ChatGPT推荐算法、ChatGPT行业数据分析等的应用方法和实战项目案例。本书内容通俗易懂、案例丰富、实用性强,特别适合对数据分析和人工智能感兴趣的读者,包括但不限于数据分析师、数据科学家、数据工程师、有数据分析需求的业务人员、研究人员、学生以及所有想要利用ChatGPT进行数据分析的读者。另外,本书也适合作为相关培训机构的教材使用。 -
R语言统计分析与可视化从入门到精通张良康 著本书循序渐进、深入讲解了R语言数据统计分析与应用的核心知识,并通过具体实例的实现过程演练了知识点的用法和流程。全书共16章,分别讲解了R语言基础、R语言数据统计语法基础、数据获取和处理、绘制可视化统计图、描述性统计分析、探索性数据分析、推论统计、回归分析、方差分析、非参数统计分析、主成分分析、聚类分析、生存分析、因子分析、基于机器学习的患者再入院预测分析系统和中概科技指数统计分析与投资系统。全书简洁而不失其技术深度,内容丰富全面,历史资料翔实齐全。同时,本书易于阅读,以极简的文字介绍了复杂的案例,同时涵盖了其他同类图书中很少涉及的历史参考资料,是学习R语言数据统计分析与应用的实用教程。
