数据库
-
可视化指南[德]克里斯蒂安·多明斯基 (Christian Tominski) [德] 海德伦·舒曼 (Heidrun Schumann) 著,邰牧寒 译本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密集型应用领域的从业者都能够轻松阅读本书。
-
Effective数据科学基础设施[芬] 维莱·图洛斯(Ville Tuulos)著,郭涛 译"数据科学项目日益增多,每个项目在提出原型到生产的过程中都需要可靠的基础设施。使用《Effective数据科学基础设施》介绍的一些新技术和新工具,你将能建立一个适用于各类组织(无论是初创企业还是大型企业)的基础设施堆栈。 《Effective数据科学基础设施》可帮助你建立数据流程和项目工作流,为你开发项目带来强大动力。《Effective数据科学基础设施》呈现Netflix数据操作的**进工具和概念,并在此基础上介绍一种可定制的基于云的模型开发和MLOps方法,可轻松适应公司的特定需求。当团队把数据科学和机器学习应用于广泛的业务问题时,这些实用的数据流程将更高效地生成更完美的结果。 主要内容 ● 在云中处理计算和编排 ● 将基于云的工具耦合到一个内聚的数据科学环境中 ● 使用Metaflow、AWS和Python数据生态系统开发可复制的数据科学项目 ● 构建需要大型数据集和模型,需要数据科学家团队参与的复杂应用程序"
-
SQL数据分析[美]凯西·谷村(Cathy Tanimura)本书的主要内容有:学习准备分析数据的关键步骤。使用SQL的日期和时间操作进行时间序列分析。使用同期群分析研究群体如何随时间变化。使用SQL的强大功能和操作符进行文本分析。检测数据中的异常值,并用代替值替换它们。使用实验分析建立因果关系,也称为A/B测试。
-
大数据相似查询关键技术研究孙佶 著《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。《大数据相似查询关键技术研究》共五章:第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。第4章基于相似查询的数据融合规则生成,介绍了一种基于相似查询的人在回路实体融合系统。第5章总结与展望,总结了全书的主要研究工作,并对未来的工作做出展望。
-
NoSQL数据库入门与实践刘瑜 安义 王晓智在大数据爆发的短短10多年中,NoSQL成为处理大数据必须掌握的热门核心技术之一。《NoSQL数据库入门与实践(基于MongoDB、Redis)(第2版)》正是在这种背景下应运而生的,本书结合MongoDB、Redis和测试工具等全面介绍NoSQL数据库技术,是一本NoSQL数据库入门图书,也是初学者了解NoSQL 技术全貌的图书。全书包括3部分,其中NoSQL基础部分包括初识NoSQL、TRDB与NoSQL的技术比较、NoSQL数据存储模式;NoSQL实践部分(电商大数据)分别介绍了文档数据库MongoDB和键值数据库Redis 入门及提高知识,并通过两个电商平台综合案例详细介绍了MongoDB和Redis在实现不同业务(如日志存储、商品评价、订单信息记录、点击量存储、商品推荐、购物车、记录浏览商品行为等)功能模块开发过程中的具体应用;NoSQL提高部分(电商大数据〉介绍了大数据环境下MongoDB和Redis 在操作速度和数据存储方面的优化方法和处理技术,以及对NoSQL产品实际业务应用的选择及部署和NoSQL辅助工具的应用。本书既可以让读者学好NoSQL基础知识、掌握NoSQL数据库技术、具备代码实战水平,又能培养读者系统性考虑问题的能力,对有较高要求的读者还给出了深入学习的方向和核心内容。《NoSQL数据库入门与实践(基于MongoDB、Redis)(第2版)》一书除纸质介绍外,前9章还提供了视频讲解,手机扫描二维码即可观看,并提供全书的源代码,方便读者快速学习。《NoSQL数据库入门与实践(基于MongoDB、Redis)(第2版)》一书语言通俗易懂,内容由浅入深,非常适合想全面了解NoSQL 知识的高校学生、教师及相关IT工程师参考学习,也适合所有对NoSQL数据库感兴趣的技术人员阅读。
-
数据隐私与数据治理孟小峰 等编著本书以《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》为背景,旨在从概念和技术的角度对数据隐私与数据治理进行系统概述。首篇从历史与系统的角度介绍数据隐私与数据治理的基础,后三篇分别侧重大规模数据收集、机器学习,以及数据治理中的隐私问题,介绍其相应的技术基础,总结当下的关键问题与技术方案。本书从全新的数据生态的角度介绍数据隐私与数据治理,在内容介绍上,以技术与算法的讲解为主,辅以案例,详略得当。
-
设备大数据郑泽宇针对我国设备大数据相关研究刚刚起步的现状,本书以设备健康管理为落脚点,从方法创新和探索应用两个方面对数据采集、存储以及处理分析进行了系统性介绍和阐释。本书介绍了传感器、PLC、工业网关等数据采集中比较重要的几个部分,以及多种不同类型设备大数据的存储方式。本书从模式识别、降维处理及分类与聚类三个方面介绍了设备大数据的分析方法,并利用实际工业过程中的四个案例讲解了大数据为设备状态分析带来的新方法,力图给设备健康领域的技术工程师、科研人员,以及对设备数据处理分析感兴趣的人员,提供系统全面的设备大数据理论知识与应用介绍。
-
HCIA-openGauss学习指南华为技术有限公司本书是华为 HCIA-openGauss 认证考试的官方教材。本书首先对 openGauss 数据库进行概述;其次介绍了 openGauss 的体系架构及关键特性;接着讲解了 openGauss 数据库安装部署的过程,并对 openGauss数据库及核心对象进行了详细说明;还介绍了 SQL 基础,其中包括 SQL 操作符、常用函数和语法分类等;最后介绍了华为云数据库GaussDB(for openGauss)及其应用场景。除了有全面的知识讲解,本书还有综合案例,通过理论与案例结合,帮助开发者快速掌握 openGauss 数据库的开发技能。本书不仅适合备考 HCIA-openGauss 认证的人员和从事软件开发工作的专业人员阅读,还适合高等院校相关专业的学生、准备投身数据库领域的人员及网络技术爱好者阅读。
-
分布式商业生态战略思二勋本书从新时代商业环境出发,紧随市场热点,如分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)、元宇宙、Web 3.0 、资产数字化、反垄断、要素市场化配置等,以企业数字化转型为核心,以区块链等数字化技术为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成本、高效率发展方案。本书全面分析了分布式商业产生的背景及其本质内涵,认为分布式商业是未来商业演化的必然趋势。分布式商业生态战略不但是未来企业生存的基本战略,而且是元宇宙商业生态建设的底层逻辑,并将Web 3.0 、DAO、NFT、元宇宙等新兴事物融入分布式商业生态体系中,深度解读了数字化时代的新商业逻辑和战略思维。同时,就分布式商业生态战略的具体设计要素和生态建设内核进行深度分析与诠释。最后,就该战略下的组织结构和人才特征进行详解。本书在研究过程中随需以大小案例支撑研究结果的提出。本书的读者对象为区块链行业从业者、企业管理者、政府相关机构决策者,以及对数字化转型、区块链应用、NFT、元宇宙生态布局有需求的社会各界人士。
-
Trino权威指南[美]马特·富勒,[奥]曼弗雷德·莫泽,[美]马丁·特拉韦尔索 著本书详细介绍了开源的分布式SQL查询引擎Trino涉及的方方面面的知识。本书共三部分,第一部分介绍Trino的发展历史、主要功能以及如何安装和使用它,第二部分介绍Trino的内部架构、部署、连接器和所支持的SQL语句的使用等,第三部分介绍在生产环境中部署Trino的知识,以及一些真实世界的部署案例。通过学习本书,你将了解Trino在解决海量数据分析和查询问题方面的优越性,并学会在现实场景中使用它来高效地解决需要在短时间内返回结果的大数据查询问题。