数据库
-
大数据分析技术王建平、傅翠本书共分为八章,分别为数据分析概述、外部数据的获取、数据处理、函数的应用、数据透视表与数据透视图、数据分析与可视化、Excel数据分析实例、撰写数据分析报告。本书注重平衡理论知识和实践应用,每章都包含了实际应用案例和实训活动,以帮助读者深入理解和掌握所学知识。本书既可作为中等职业院校计算机类专业课程教材,也可作为相关企业培训教材。 -
Power Query M函数应用技巧与实战邹慧本书以实战案例为主线,以函数理论基础为核心,引导读者从整体上理解Power Query的灵活应用,从实例中获得解决问题的思路和灵感。 本书共24章,分为原理篇、实战篇、函数篇、扩展篇,详细讲解了PQ的原理和函数应用。原理篇详细讲述三大数据结构(简称为三大容器)的原理和M函数的传参,实战篇通过案例讲函数,函数篇按照类名讲函数,扩展篇讲解自定义函数等灵活的应用。 本书的特点是,举一反三把逻辑原理讲透、用类比法强化记忆、案例配套在线视频。不管使用Excel还是PQ处理数据,不仅要求快,更要准确,本书列举了许多数据处理的思维和细节,提醒读者避坑。 本书面向会PQ界面操作的用户,作为从基础到中级水平的进阶参考书。 -
数据分析与预测算法[美]拉斐尔·A. 伊里萨里本书介绍可以帮助读者处理真实数据分析挑战的概念和技能。它涵盖了概率论、统计推断、线性回归和机器学习等概念。它还帮助读者提升如下技能:R编程、数据清洗、数据可视化、预测算法构建、使用UNIX/Linux shell组织文件、使用Git和GitHub进行版本控制以及可复制的文档准备。全书分为六个部分,分别为R、数据可视化、统计与R、数据清洗、机器学习和生产力工具。 -
梯度提升算法实战[美]科里·韦德(Corey Wade),张生军XGBoost是一种经过行业验证的开源软件库,为快速高效地处理数十亿数据点提供了梯度提升框架。首先,本书在介绍机器学习和XGBoost在scikit-learn中的应用后,逐步深入梯度提升背后的理论知识。读者将学习决策树,并分析在机器学习环境中的装袋技术,同时学习拓展到XGBoost的超参数;并将从零开始构建梯度提升模型,将梯度提升扩展到大数据领域,同时通过计时器的使用了解速度限制。接着,本书重点探讨XGBoost的细节,着重于速度提升和通过数学推导导出参数。通过详细案例研究,读者将练习使用scikit-learn及原始的Python API构建和微调XGBoost分类器与回归器;并学习如何利用XGBoost的超参数来提高评分、纠正缺失值、缩放不平衡数据集,并微调备选基学习器。最后,读者将学习应用高级XGBoost技术,如构建非相关的集成模型、堆叠模型,并使用稀疏矩阵、定制转换器和管道为行业部署准备模型。本书适合作为高等学校计算机专业、软件工程专业的高年级本科生及研究生教材,同时适合有一定机器学习基础的数据科学家、机器学习工程师和研究人员阅读,可为解决复杂的机器学习问题提供实用指导。 -
大数据算法[以] Moran Feldman 著,祝全亮 孙琳 译互联网的出现使人们第一次能够访问大量的数据。比如,社交网络Facebook中的友谊图和互联网网站之间的链接图。这两幅图都包含超过10亿个节点,代表巨大的数据集。如果要使用这些数据集,就必须对其进行处理和分析。然而,仅仅是它们的大小就使得这种处理非常具有挑战性。特别是,为处理中等规模的数据集而开发的经典算法和技术,在面对如此大的数据集时往往需要超出常规的时间和空间。此外,在某些情况下,存储整个数据集甚至是不可行的,因此,必须在数据集的各个部分对其进行处理,然后很快丢弃每部分。上述挑战推动了加工处理“大数据”(海量数据)的新工具和新技术的发展。在本书中,我们对这项工作采取了计算机科学理论的观点。特别是,我们将研究旨在捕捉“大数据”计算带来的挑战的计算模型,以及为应对这些挑战而开发的实际解决方案的特性。我们将通过调查一些经典的算法结果,包括许多最先进的结果,来了解这些计算模型中的每一个模型。本书的设计有两个相互矛盾的目标,如下所示:(1)试图在大数据背景下,给出计算机科学理论工作的一个大概的工作原理。(2)力求做到有足够的细节,使读者能够参与所涵盖主题的研究工作。 -
新型数据库系统金培权 赵旭剑数据库技术自从上世纪60年代诞生以来,经历了网状数据库、层次数据库等发展阶段,zui终在80年代确立了关系数据库技术的主导地位。关系数据库技术经过几十年的发展,在各行各业都取得了巨大的成功。但是,进入21世纪后,随着互联网、物联网、云计算等技术的快速发展,传统的关系数据库技术由于在可扩展性、灵活性等方面存在的不足,难以支持层出不穷的新型应用。在此背景下,键值数据库、文档数据库、列存储数据库、图数据库等新型数据库技术因运而生。本书与现有的介绍关系数据库技术为主的书籍不同,重点介绍当前数据库领域中出现的各类新型数据库系统的概念、基础理论、关键技术以及典型应用。在理论方面,本书除了介绍各类新型数据库系统中基本的理论和原理之外,还将侧重于对这些理论的研究背景和动机进行讨论,使读者能够了解新型数据库系统在设计上的先进性,并通过与成熟的关系数据库技术的对比,明了新型数据库技术的应用方向以及存在的局限性。在应用方面,本书将侧重与实际软件工程相结合,通过实际的应用示例介绍各类新型数据库系统在实际应用中的使用方法和流程,使读者能够真正做到学以致用。 -
多源数据的统计分析与建模方方,邵军内容提要:随着数据采集技术以及存储技术的不断进步,现代科学研究和实践中需要处理和分析的数据已经从单一来源向多个来源转变。在医学研究、生物信息、市场研究、金融风险管理、气象环境科学等诸多重要领域,多源数据的现象普遍存在,在带来巨大机遇的同时也给统计分析建模带来了全新的挑战。针对这一国际前沿问题,本书主要介绍作者最近几年在两大方面的主要工作:一是多源碎片化数据的建模和预测,二是有效利用多源外部数据的统计推断。读者对象:统计及其相关专业的本科生、研究生,相关领域的科研工作人员。 -
制造企业数据空间设计理论与方法梁荣华 郭忠文 丁菡 孙国道在《“十四五”智能制造发展规划》中,我国明确将智能制造作为建设制造强国的主攻方向,并认识到其发展水平对我国制造业的质量和竞争力具有直接影响。在这一背景下,本书依托国家重点研发计划项目“制造企业数据空间设计理论与方法”,致力于研究制造企业的数据空间设计理论和方法。项目取得了在数据空间管理引擎、基于数据空间的归因推断、知识发掘、学习决策技术和数据空间原型系统构建等方面的科研成果。目标是构建一套完整的数据空间管理体系,包括因果推断、知识发掘、学习决策和智能服务等软件构件,为制造企业实现全流程的可控性和信息共享提供支持。本书的专业性和实用性较强,可为企业的信息技术专业人员和技术架构师、数据管理人员或是从事于数据管理和数据分析领域的专业人士提供参考。也适用于学术界的研究人员和学生参考学习。 -
数据治理实践者手记苏振中 刘永强数据治理是一门实践中的学问。本书轻理论、重实践,是一份实用的数据治理指南,涉及数据治理组织、管理制度、流程规范、数据标准管理、数据质量管理、元数据管理、主数据管理、数据安全与隐私等主题。全书共分为3篇,第一篇包含第1章和第2章,介绍数据治理的理论与方法;第二篇包含第3章至第6章,介绍数据治理的平台建设与工具;第三篇包含第7章至第9章,介绍不同场景下的数据治理案例,通过案例场景细节解读和工作步骤阐述,帮助读者将数据治理理论转化为切实可行的解决方案和行动策略。本书适合数据管理专家、企业决策者、数据治理从业者,以及对数据治理感兴趣的人士阅读。 -
智慧博物馆公众服务郑霞广博的网络空间里,藏品以数字化的形态储存,检索、提取、分析、欣赏,物与人之间“零距离”;多种类的服务场景里,博物馆体验走向定制化,打破虚拟与现实的边界,公众在展厅内外开启自由多样的智识旅程。在智慧博物馆,千里在俄顷,三江坐超忽。历经信息化、数字化时代,博物馆已走上智慧化实践的征程。利用物联网、大数据、云计算和移动通信等新技术,整合博物馆信息资源,重建信息交流通道,实现智慧服务、智慧保护、智慧管理。通过感知、互通和互联,智慧博物馆更加突出“以人为中心”。本书辨析智慧博物馆公众服务的定义、特征和内容,构建智慧博物馆公众服务的系统框架;分析面向公众服务的数据资源建设与管理,阐述系统感知、运行和发展的过程;构建绩效评价指标体系和完善机制保障,从内外部确保智慧博物馆公众服务的平稳有效运行。从顶层设计出发,为智慧博物馆的发展提供了一个广阔的宏观视角。 推荐语博物馆作为人类重要的非正式学习场所,通过漫长的探索建立起一套较为有效的学习机制,对人类的知识生活做出了重要的贡献。智慧博物馆坚持需求驱动、业务引领,通过重新梳理和构建博物馆各要素的关联关系而形成合力,克服了博物馆内部各自为政和信息孤岛的现象。在智慧博物馆建设中,如何协调“智慧”与“公众服务”的关系是一个关键问题,本书对两者的关系展开了充分的辨析,并从广义信息传播的维度,深度探讨了智慧博物馆公众服务在展览、教育和传播三方面所涉及的内容,为我们指出了智慧博物馆如何从系统化、体系化角度为公众提供更有效服务的发展路径。——浙江大学艺术与考古学院教授 严建强 在历经十多年理论与实践的基础上,中国智慧博物馆建设仍处于进行时态。因此,探讨当下智慧博物馆建设的若干理念性问题,更深入地界定智慧博物馆,是博物馆可持续发展的热门话题。这本书提出了一个可以用来探索如何更好为公众提供服务的系统框架,从情境感知的角度,细致入微地剖析了场景化服务,为数据驱动博物馆服务提供了一个实用的服务体系。无论你是博物馆工作者,还是对博物馆公众服务感兴趣的读者,本书都是一本不容错过的作品。——浙江省博物馆副馆长 蔡琴 本书系统阐述了智慧博物馆公众服务的特征、构成要素、架构等,重点讲述了如何发挥数据的价值来提升博物馆服务水平。作者采用了新理念新思路,观点新颖,对博物馆管理者有较好的参考借鉴作用。 ——中国国家博物馆数据管理与分析中心主任李华飙
