数据库
-
基于PySpark的高级数据分析Akash Tandon,Sandy Ryza,Uri Laserson,Sean Owen和Josh Wills 著本书的主要内容有:熟悉Spark的编程模型和生态系统。学习数据科学的一般方法。检查分析大型公共数据集执行步骤的完整性。发现哪些机器学习工具对特定问题有帮助。探索可适应多种用途的代码。 -
经典并行与量子并行刘宇航本书深入浅出介绍后摩尔时代的并行计算核心技术,理论与实践并重,同时兼顾数学模型、结构模型、编程模型。本书具有以下特色:从概念上明确算势与算力的联系与区别,强调在后摩尔时代背景下从潜在能力(算势)到实际能力(算力)的充分转化的重要性;注重量化分析和理论推导,单列一章对计算性能模型和存储性能进行了介绍;注重并行应用程序的设计,单列一章介绍并对比分析了共享存储编程与非共享存储编程的基本原理;注重融会贯通,培养整体观念,分别考察了共享存储结构和分布式存储结构,揭示潜在的可利用的并行硬件资源以及对应的编程方法;编制了大量的原创的有助于提高读者理解深度和应用知识能力的例题;在国内外同类教材或专著中,率先以算势和算力的统一的视角,系统对比了经典并行计算与量子并行计算,促进两个领域的沟通融合。 -
基于鲲鹏的分布式图分析算法实战张志威 袁野 曹莉本书全面、系统地介绍了单机和分布式图分析算法的理论基础、框架、实战应用等,侧重理论与实践相结合。在内容组织上,首先,本书整体介绍图分析技术的发展历程和现状,并分析图分析技术面临的挑战。其次,本书系统介绍了以下内容:单机图分析算法的基本原理、常用场景和基础解法;分布式图分析技术的关键步骤解析及调优策略指导;业界经典的大数据平台和主流的分布式开发框架,以及分布式图计算框架的运行机制和任务调度策略;结合工业界软硬件(鲲鹏芯片和鲲鹏BoostKit加速库)对分布式图分析算法进行调优的方法。最后,本书将分布式图分析技术应用于实际场景,帮助读者基于业务场景进行分布式图计算框架选型。本书既可以帮助对大数据图分析算法感兴趣的读者了解典型图分析算法的原理与优化技术,也可以作为华为鲲鹏图分析算法框架下的实践参考书。 -
Apache ShardingSphere权威指南潘娟 张亮 [阿尔及利亚]亚幸·西·塔伊布(Yacine Si Tayeb)Apache ShardingSphere 是一个基于可插拔特性和云原生原则的新开源生态系统,将其用于分布式数据基础设施有助于增强数据库性能。本书首先简要概述数据库管理系统在生产环境中面临的主要挑战和数据库软件的内核概念;然后介绍使用分布式数据库解决方案、弹性伸缩、用户身份认证、SOL授权、全链路监控、数据库网关和 DistSOL的真实示例,全面讲解 ShardingSphere 的架构组件,以及如何利用它们配置和插入现有的基础架构并管理数据和应用;接着介绍生态系统的客户端 ShardingSphere-JDBC 和 ShardingSphere-Proxy,以及它们如何同时或独立地工作以满足实际需求;最后讲解如何定制可插拔架构以定义个性化的用户策略和无缝管理多个配置,并在各种场景下对数据库进行基准测试和性能测试。 -
数据流通李晔、刘阳荷、刘心田、张华庆本书从数据流通的背景、基础、场景应用、市场生态体系、机制体制、趋势展望六个方面对数据流通的基础知识与实际应用进行介绍。 综合本书内容可见,第一,本书是理论与实践的结合。以数据和数字经济的基础理论为出发点,再论述数据发挥作用的途径以及具体的实践应用,有助于对数据流通问题的理解。第二,内容覆盖了数据流通的各个环节、多个行业,从技术分析到机制设计。第三,数据流通是快速发展的领域,提供了相对前沿的知识。 读者对象:期望了解数据流通和数字经济的学者、企业从业者、政府工作人员、学生等。 -
数据要素化时代的数据治理上海市静安区国际数据管理协会随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇“新理论、新方法和新技术”介绍数业的逻辑及路径、数据治理的闭环管理方法、数据资产价值的呈现、数据治理的共治共享、精益数据治理,以及数据治理的“新四化”。第三篇“新型数据基础设施”详细介绍来自平安人寿、阿里巴巴和镜舟科技3家企业的数据中台产品的创新情况。第四篇“行业数据治理与数据安全治理”首先介绍高校是如何进行数据治理的,然后介绍数据的安全运营和数据质量问题解决之道。第五篇“企业最佳实践”分享中国石化、中电金信和中国联通3家企业在数据要素化过程中积累的经验。本书适合对数据管理、数据治理、数字化转型等相关主题感兴趣的读者阅读,尤其适合从事相关工作的读者参考借鉴。 -
Python数据分析与实战 计算机网络数据库吕一清 邓国营《Python数据分析与实战》是本以Python3为基础的数据分析和应用的实战手册,全书在内容上包括Python编制、统计学知识和经管类实例应用,内容范围广而全面,其内容结构由入门篇、进级篇、高级篇和兴趣篇四个部分构成,每一篇都是对立存在,循序渐进。学习者可以结合自身的水平从任何一个点切入学习,入门篇是针对那些没有Python基础的兴趣者,进级篇是一些第三方库的应用例子,高级篇则是一些Python综合应用的例子。娱乐篇是让学习者没有兴趣的时候,通过里面的一些例子找到乐趣,而不至于放弃的功效。 -
推荐连接万物闫泽华 著如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。 -
MySQL必知必会[美]本·福达(Ben Forta)MySQL是世界上颇受欢迎的数据库管理系统。本书从简单的数据检索开始,逐步深入讲解一些复杂的内容,包括子查询、连接的使用、全文搜索、存储过程、游标、触发器、数据库维护,等等。本书重点突出、条理清晰,系统而扼要地让你学到应该学到的知识,使你在不经意间“功力大增”。第2版基于MySQL 8进行了全面修订。 -
DolphinDB 从入门到精通之数据分析周小华DolphinDB不仅支持海量数据的高效存储与查询,更开创性地提供了功能完备的编程语言以支持复杂分析,以及高吞吐、低延时、开发便捷的流数据分析框架,是计算能力最强的数据库系统之一。本书从入门概念开始介绍,到实践应用分析,讲解深入浅出、易于理解,是一本具有实践意义的数据分析工具书。本书介绍了如何使用 DolphinDB这一集存储和高性能计算的数据库系统进行数据分析实践,提供了大量金融和物联网等场景的实践案例,读者可以通过借鉴和修改案例中的解决方案,将它们应用于自己的数据分析系统之中。即使是零基础的读者,也能通过学习本书,快速上手实践。
