数据库理论
-
Python数据分析从小白到高手王国平 编著大数据时代,掌握必要的数据分析能力,将大大提升你的工作效率和自身竞争力。Python是数据分析的一大利器,本书将详细讲解利用Python进行数据分析与可视化的相关知识。《Python数据分析从小白到高手》主要内容包括:Python入门、搭建开发环境、语法、数据类型、数据加载、数据准备、数据可视化、机器学习、深度学习、自然语言处理等,并通过三个综合案例将这些知识加以运用。本书内容丰富,采用全彩印刷,配套视频讲解,结合随书附赠的素材边看边学边练,能够大大提高学习效率,迅速掌握Python数据分析技能,并用于实践。本书适合数据分析初学者、初级数据分析师、数据库技术人员等自学使用。同时,本书也可用作职业院校、培训机构相关专业的教材及参考书。 -
应用预测建模(美)马克斯·库恩,谢尔·约翰逊本书专注于预测建模的实际应用,介绍了从数据预处理到建模再到模型评估和选择的整个过程,以及背后的统计思想,涉及各种回归技术和分类技术。从解决实际问题延伸到模型拟合,以及随之出现的主题,如处理类不平衡、选择预测因子等在实践中经常出现的问题,作者意在为读者提供预测建模过程的指导,并结合开源软件R语言来求解实际问题,详细给出R代码和处理的步骤。R包AppliedPredictiveModeling包含了书中例题和习题使用的数据,以及用于重复书中每一章分析的R代码。 -
企业级数据架构李杨这是一本能指导企业在数字化转型和数据要素时代通过数据架构用好数据、管好数据、充分发挥数据价值的著作。从0到1讲解了数据架构的技术栈、方法论与落地实践,揭示了数据架构的底层逻辑,总结了数据架构的核心要素和架构模型,阐述了数据治理、数据资产管理以及数据平台的搭建等全方位的内容,是作者10余年数据工作经验的总结。本书主要分为五部分:第一部分:架构基础,对企业架构的组成要素以及流行的企业架构框架进行了总览性质的介绍,数据架构是重点;第二部分:数据架构基础,详细讲解了数据架构的组成、数据存储、数据调度与消息传输、Lambda架构和Kappa架构以及数据架构的辅助资源组件;第三部分:数据架构模型,首先介绍了企业内部数据区的划分与内部数据的流向,然后讲解了数据模型的建模策略、步骤和方法,以及维度建模的详细内容;第四部分:数据管理,讲解了数据架构的核心内容,包括元数据管理、数据质量管理、数据标准管理、数据治理和数据资产管理等的方法和实践;第五部分:数据架构实践,通过离线计算和实时计算两大场景中的综合案例,对前面的内容进行了融合,手把手教读者进行数据架构实践。本书内容通俗易懂,注重实践,不仅浓缩了作者在日常工作中的思考、解决问题的思路,还融入了该领域优秀同行的经验和实践,相信对读者会有一些帮助。 -
分布式数据库基础与应用闭应洲 许桂秋 刘军本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。 本书共11章,采用原理+代码实例 综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书,亦可作零基础人员学习分布式数据库技术的入门图书。 -
联动Oracle玉素甫·买买提【为宏观掌握Oracle基础(第1~3章)】,介绍了进程管理、内存管理及存储等基础知识,并且讲解了常用Linux操作系统性能工具的使用及结果分析方法,旨在帮助读者了从宏观视角掌握Oracle数据库体系架构和进程组织方案。【微观理解Oracle原理(第4~8章)】,围绕Oracle内部运行原理展开讲解。首先,在Oracle数据结构的基础上讨论日志和回滚。其次,引入了排队论和排队系统中的概念,对比法讲解了Oracle的数据缓冲区高速缓存和共享池设计思想及运行原理。【串联Oracle运行流程(第9~11章)】,结合实践案例将从提交SQL至结果返回的整个过程串起来,首先总结归纳了Oracle算法和数据结构的重要知识点,打通了Oracle原理与数据结构之间的桥梁。其次,通过典型案例讲解AWR报告,让读者能够了解完整的Oracle诊断思路。再次,介绍了集群技术、Oracle RAC及其日志结构。然后,对Oracle多租户架构的演进过程及部分新特性进行了简要讨论及总结。 -
数据治理驱动的数字化转型王建峰 辛华数据作为生产要素已经被提升至国家战略层面,如何激活数据要素、体现数据价值,如何有效利用数据赋能数字化转型,成为当前炙手可热的问题。本书厘清了数据治理、数据管理和数字化转型的关系,介绍了数据治理核心工作中经常出现的问题和优秀实践,明确了数字化转型的核心内容、方法路径和评估机制,通过大型企业数据治理或数字化转型案例为读者提供有价值的参考。本书适合首席执行官、首席信息官、首席数据官等从事企业管理和数据管理工作的人员阅读,有助于提升对数据治理和数字化转型的认识,为在组织中有效开展数据治理和数字化转型工作提供思路和借鉴。 -
AIGC辅助数据分析与挖掘宋天龙内容简介这是一本能指导数据分析师和数据挖掘工程师在AIGC时代快速实现能力跃迁的著作,教会他们使用ChatGPT等AIGC工具,大幅提升数据分析与挖掘的能力和效率。全书围绕Excel、SQL和Python这3大常用的数据分析和挖掘工具展开,从方法和实践2个维度系统讲解了如何使用ChatGPT和Bing Copilot等AIGC工具来辅助提升效率。全书一共8章,内容可以分为四个部分:1.AIGC工具使用和Prompt撰写首先详细介绍了数据分析与挖掘能用到的各种AIGC工具的使用方法和注意事项,然后全面讲解了如何面向数据分析与挖掘场景构建高质量的Prompt,包括大量的方法和最佳实践。2.AIGC辅助Excel数据分析与挖掘方法角度,详细阐述了AIGC工具如何辅助Excel数据分析与挖掘,包括数据集生成、数据管理、数据处理、数据分析和数据展示等;实践角度,通过RFM分析、时间序列分析和相关性分析等3个方面的案例讲解了AIGC工具与Excel在不同场景中的结合使用。3.AIGC辅助SQL数据分析与挖掘方法角度,详细讲解了AIGC工具如何辅助SQL数据分析与挖掘,包括数据准备、查询、清洗、转换、分析等;实践角度,通过广告渠道评估、归因报表、留存报表等3个方面的案例讲解了AIGC工具与SQL在不同场景中的结合使用。4.AIGC辅助Python数据分析与挖掘方法角度,详细讲解了AIGC工具如何辅助Python数据分析与挖掘,包括环境构建、数据探索、数据处理、AutoML等;实践角度,通过广告预测、商品分析和KPI监控等3个方面的案例讲解了AIGC工具与Python在不同场景中的结合使用。除此之外,本书还全面总结了用AIGC辅助这3种数据分析与挖掘工具时会遇到哪些问题以及有哪些注意事项。 -
分布式数据服务徐子晨 柳杰 娄俊升随着物联网、云计算、大数据与人工智能等技术的蓬勃发展,计算服务逐渐从计算密集型向数据密集型(Data Intensive)转变。高性能、高通量的数据服务关键技术成为智慧城市、智能制造、智慧农业等国家重大需求解决方案的核心基础。并行与分布式数据处理的概念启发于上世纪80年代,源自讨论在内存及二级存储极为有限的条件下如何跨越“内存墙”,完成计算任务的优化技术。而今,互联网与私有网络数据指数级增长、数据服务的事务性需求复杂多变、跨地域数据同步需求动态不统一、如何应对当前及未来大数据服务及其上的人工智能计算对并行与分布式数据服务提出了新的问题与挑战。本书从并行与分布式数据服务的基础理论、事务模型、数据处理语言等基础内容,并进一步讨论分布式数据一致性模型及全观性的数据处理架构方面的先进及实用的研究及系统软件相关知识,,对分布式数据服务的其他研究也进行了概述,并对其未来发展方向进行展望。本书可以作为计算机、数据科学与大数据技术、人工智能等相关专业的高年级本科生与研究生在数据库理论及分布式系统等课程上的辅助教材,也可以为物联网、云计算、大数据与人工智能等领域的科研人员及从业者提供创新研究与技术应用的参考。 -
云原生应用开发实战51Aspx本书是一本介绍 .NET 云原生开发技术的实用教程,由多位微软MVP联合编写,通过实际的项目代码,从多个角度深入浅出地阐释了云原生开发的理论和在实际开发中的应用。全书共11章,主要内容包括:迎接云原生的浪潮;配置 .NET 云原生开发与运行环境;云原生应用开发—电子商务应用eShopOnContainers;实现云原生应用的扩展性;实现云原生应用的通信;数据访问模式;实现可恢复的弹性应用;实现云原生应用的身份管理;实现云原生应用的可观察性;深入理解云原生、容器、微服务和DevOps:基于Dapr开发云原生应用。本书适合具有 C# 开发经验的软件工程师、软件架构师,希望学习最新的 .NET 技术,完成云原生应用开发转型的开发人员阅读。对于希望从头开始学习 .NET 技术和云原生开发的开发人员也是非常好的选择。 -
数据中台付登坡 江敏 赵东辉 等在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业“管好数据、用好数据”为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。本书一共17章,逻辑上分为四个部分:第1部分 数据中台建设方法与架构设计(第1~3章)首先,从产生、定义、认知、相关概念、建设方法论、架构等方面对数据中台进行了全面介绍,帮助读者建立对数据中台的清晰认识和理解,熟悉数据中台的建设机制;然后,总结了企业数据应用成熟度评估、数据中台在各个行业的应用场景,以及数据中台的成功要素。第2部分 数据中台建设内容与运营方法(第4~10章)深入讲解了数据中台的核心模块,包括数据汇聚、数据开发、数据体系建设、数据资产管理、数据应用体系建设、数据中台运营机制、数据安全管理等,不仅介绍了如何实现一个数据中台,还介绍了数据中台的运营方法与经验。第3部分 数据中台工程化交付体系(第11章)首先介绍了数据中台工程化交付体系的概念,然后从交付团队、交付内容、交付环节任务、交付实施思路四个方面详细讲解了数据中台工程化交付框架的内容和结构,最后提出数据中台的交付是一个可持续演进的过程。第4部分 数据中台行业解决方案与案例(第12~17章)结合政务、制造、汽车、地产、零售、医药等6个行业的数据中台实践案例,从项目背景、项目需求、项目实施、项目价值四个维度讲解了数据中台的建设思路、实施过程与运营方法。本书内容是数澜科技7年来为1000余家大中型政企机构提供数据基础设施服务的经验总结,第1版累计销量超过10万册,好评率超过99%,第2版更新和新增的篇幅超过60%。
