数据库
-
大数据算法[以] Moran Feldman 著,祝全亮 孙琳 译互联网的出现使人们第一次能够访问大量的数据。比如,社交网络Facebook中的友谊图和互联网网站之间的链接图。这两幅图都包含超过10亿个节点,代表巨大的数据集。如果要使用这些数据集,就必须对其进行处理和分析。然而,仅仅是它们的大小就使得这种处理非常具有挑战性。特别是,为处理中等规模的数据集而开发的经典算法和技术,在面对如此大的数据集时往往需要超出常规的时间和空间。此外,在某些情况下,存储整个数据集甚至是不可行的,因此,必须在数据集的各个部分对其进行处理,然后很快丢弃每部分。上述挑战推动了加工处理“大数据”(海量数据)的新工具和新技术的发展。在本书中,我们对这项工作采取了计算机科学理论的观点。特别是,我们将研究旨在捕捉“大数据”计算带来的挑战的计算模型,以及为应对这些挑战而开发的实际解决方案的特性。我们将通过调查一些经典的算法结果,包括许多最先进的结果,来了解这些计算模型中的每一个模型。本书的设计有两个相互矛盾的目标,如下所示:(1)试图在大数据背景下,给出计算机科学理论工作的一个大概的工作原理。(2)力求做到有足够的细节,使读者能够参与所涵盖主题的研究工作。 -
大数据分析技术王建平、傅翠本书共分为八章,分别为数据分析概述、外部数据的获取、数据处理、函数的应用、数据透视表与数据透视图、数据分析与可视化、Excel数据分析实例、撰写数据分析报告。本书注重平衡理论知识和实践应用,每章都包含了实际应用案例和实训活动,以帮助读者深入理解和掌握所学知识。本书既可作为中等职业院校计算机类专业课程教材,也可作为相关企业培训教材。 -
数据治理实践者手记苏振中 刘永强数据治理是一门实践中的学问。本书轻理论、重实践,是一份实用的数据治理指南,涉及数据治理组织、管理制度、流程规范、数据标准管理、数据质量管理、元数据管理、主数据管理、数据安全与隐私等主题。全书共分为3篇,第一篇包含第1章和第2章,介绍数据治理的理论与方法;第二篇包含第3章至第6章,介绍数据治理的平台建设与工具;第三篇包含第7章至第9章,介绍不同场景下的数据治理案例,通过案例场景细节解读和工作步骤阐述,帮助读者将数据治理理论转化为切实可行的解决方案和行动策略。本书适合数据管理专家、企业决策者、数据治理从业者,以及对数据治理感兴趣的人士阅读。 -
新型数据库系统金培权 赵旭剑数据库技术自从上世纪60年代诞生以来,经历了网状数据库、层次数据库等发展阶段,zui终在80年代确立了关系数据库技术的主导地位。关系数据库技术经过几十年的发展,在各行各业都取得了巨大的成功。但是,进入21世纪后,随着互联网、物联网、云计算等技术的快速发展,传统的关系数据库技术由于在可扩展性、灵活性等方面存在的不足,难以支持层出不穷的新型应用。在此背景下,键值数据库、文档数据库、列存储数据库、图数据库等新型数据库技术因运而生。本书与现有的介绍关系数据库技术为主的书籍不同,重点介绍当前数据库领域中出现的各类新型数据库系统的概念、基础理论、关键技术以及典型应用。在理论方面,本书除了介绍各类新型数据库系统中基本的理论和原理之外,还将侧重于对这些理论的研究背景和动机进行讨论,使读者能够了解新型数据库系统在设计上的先进性,并通过与成熟的关系数据库技术的对比,明了新型数据库技术的应用方向以及存在的局限性。在应用方面,本书将侧重与实际软件工程相结合,通过实际的应用示例介绍各类新型数据库系统在实际应用中的使用方法和流程,使读者能够真正做到学以致用。 -
数据分析与预测算法[美]拉斐尔·A. 伊里萨里本书介绍可以帮助读者处理真实数据分析挑战的概念和技能。它涵盖了概率论、统计推断、线性回归和机器学习等概念。它还帮助读者提升如下技能:R编程、数据清洗、数据可视化、预测算法构建、使用UNIX/Linux shell组织文件、使用Git和GitHub进行版本控制以及可复制的文档准备。全书分为六个部分,分别为R、数据可视化、统计与R、数据清洗、机器学习和生产力工具。 -
机器学习大数据平台的构建、任务实现与数据治理[美] 弗拉德·里斯库蒂亚(Vlad Riscutia)著 叶伟民、刘华、余灵 译主要内容● 数据字典和数据治理● 数据质量管控、合规和分发● 构建自动化管道以提高可靠性● 数据摄取、存储和分发● 支持生产环境中的数据建模、分析和机器学习 -
多源数据的统计分析与建模方方,邵军内容提要:随着数据采集技术以及存储技术的不断进步,现代科学研究和实践中需要处理和分析的数据已经从单一来源向多个来源转变。在医学研究、生物信息、市场研究、金融风险管理、气象环境科学等诸多重要领域,多源数据的现象普遍存在,在带来巨大机遇的同时也给统计分析建模带来了全新的挑战。针对这一国际前沿问题,本书主要介绍作者最近几年在两大方面的主要工作:一是多源碎片化数据的建模和预测,二是有效利用多源外部数据的统计推断。读者对象:统计及其相关专业的本科生、研究生,相关领域的科研工作人员。 -
制造企业数据空间设计理论与方法梁荣华 郭忠文 丁菡 孙国道在《“十四五”智能制造发展规划》中,我国明确将智能制造作为建设制造强国的主攻方向,并认识到其发展水平对我国制造业的质量和竞争力具有直接影响。在这一背景下,本书依托国家重点研发计划项目“制造企业数据空间设计理论与方法”,致力于研究制造企业的数据空间设计理论和方法。项目取得了在数据空间管理引擎、基于数据空间的归因推断、知识发掘、学习决策技术和数据空间原型系统构建等方面的科研成果。目标是构建一套完整的数据空间管理体系,包括因果推断、知识发掘、学习决策和智能服务等软件构件,为制造企业实现全流程的可控性和信息共享提供支持。本书的专业性和实用性较强,可为企业的信息技术专业人员和技术架构师、数据管理人员或是从事于数据管理和数据分析领域的专业人士提供参考。也适用于学术界的研究人员和学生参考学习。 -
创新永动[巴林],沙纳瓦兹·汗,[印],蒂鲁纳卡拉苏·K,等 著,樊秀梅,傅博 译随着云技术的迅猛发展和普及,商业组织正面临着满足用户需求的巨大挑战。本书深入探讨了云技术在数字化社会中的重要地位和创新应用。通过研究、创新和发展的视角,本书引领读者走进云技术的前沿,揭示了其在构建下一代卓越计算环境中的关键作用。书中汇集了多位专家学者的研究成果和实践经验,为读者提供了宝贵的洞察和指导。无论是对于云计算领域的专业人士,还是对于对数字化社会感兴趣的读者,本书都是一本不可或缺的参考书。通过阅读本书,您将深入了解云技术在数字化社会中的影响和价值,激发您的创新思维,为您在未来的技术革新中取得卓越成就打下坚实的基础。 -
Power Query M函数应用技巧与实战邹慧本书以实战案例为主线,以函数理论基础为核心,引导读者从整体上理解Power Query的灵活应用,从实例中获得解决问题的思路和灵感。 本书共24章,分为原理篇、实战篇、函数篇、扩展篇,详细讲解了PQ的原理和函数应用。原理篇详细讲述三大数据结构(简称为三大容器)的原理和M函数的传参,实战篇通过案例讲函数,函数篇按照类名讲函数,扩展篇讲解自定义函数等灵活的应用。 本书的特点是,举一反三把逻辑原理讲透、用类比法强化记忆、案例配套在线视频。不管使用Excel还是PQ处理数据,不仅要求快,更要准确,本书列举了许多数据处理的思维和细节,提醒读者避坑。 本书面向会PQ界面操作的用户,作为从基础到中级水平的进阶参考书。
