数据库
-
数据资产入表与数据交易合规指南江翔宇内容简介这是一部立足于当下行业实践和政策指引,从工作程序和实体法律角度,对企业数据资产入表的基本内涵、具体流程、数据交易与入表工作的合规要点进行分析归纳的专著,旨在通过深入浅出的分析帮助读者实现在数据交易、数据资产入表领域的快速认知同步。作者曾经在金融监管部门、金融机构和头部互联网平台工作,是国内较早开展数据领域法律实践的律师,曾经为众多企业在场内进行数据交易的产品提供合规评估,为多个大型数据平台企业和金融机构提供数据合规、金融科技的法律服务,包括个人信息合规自评估、证券业跨行业数据共享监管沙盒项目、垂类大模型合规项目等,具有丰富的法律实践和研究深度、广度。全书共12章,主要内容如下:第1和2章数据要素市场与数据资产入表的内涵介绍首先,从数据要素市场出发对国家层面的政策和法律沿袭进行了梳理与分析,对国家顶层设计文件“数据二十条”的主要内容进行了介绍;然后,对数据资产入表的内涵和意义以及各个相关概念进行比较分析;最后,对数据资产入表的具体操作进行简明扼要的解读,帮助读者透彻理解数据要素市场和数据资产入表的底层逻辑。第3~6章数据资产入表的重点合规问题及入表准备首先,对数据资产入表与数据确权的关系进行了深入分析,明确了权属清晰对数据资产入表的底层重要性;然后,对确权相关的合规问题以及其他涉及数据资产入表的合规问题进行了深入分析,厘清了关键合规要点,特别是数据来源的合规性;最后,对数据资产入表的准备工作和主要路径进行了介绍和梳理,帮助读者迅速掌握操作思路和落地路径。第7~10章数据资产入表的数据分类合规重点就数据资产入表在主要领域的开展难点进行分析,并就上市公司和非上市公司的具体案例进行分析,给出启示。具体分为数据资产入表与公共数据、数据资产入表与个人数据、数据资产入表与人工智能三个部分,分别从数据资产入表角度对各自的合规难点、立法现状、未来展望加以深入浅出的剖析。第11章数据资产入表衍生金融化利用的思考与展望就数据资产化之后的数据资本化,即数据资产入表的金融化利用问题进行了积极而冷静的分析与思考。首先对金融意义下的数据资产管理内涵进行了分析,然后对目前数据资产的金融化探索与实践进行了分析,对其中的法律难点问题进行归纳,并对普遍性开展的难点进行分析和展望。第12章数据资产入表与数据交易首先,对数据资产入表与数据交易之间的紧密联系进行分析;然后,对数据交易的概念、内涵以及法律性质进行分析,并对场内数据交易和场外数据交易进行比较分析;最后,对数据交易中的合规性审查要点进行分析归纳。 -
Redis应用实例黄健宏本书将从内部组件、外部应用和数据结构3个方面为读者介绍Redis常见、经典的用法与实例,并且所有实例均附有完整的Python代码,方便读者学习和参考。全书分3个部分:第一部分讲内部组件,介绍的实例通常用于系统内部,如缓存、锁、计数器、迭代器、速率限制器等,这些都是很多系统中不可或缺的部分;第二部分讲外部应用,介绍的实例都是一些日常常见的、用户可以直接接触到的应用,如直播弹幕、社交关系、排行榜、分页、地理位置等;第三部分讲数据结构,介绍的实例是一些使用Redis实现的常见数据结构,如先进先出队列、栈、优先队列和矩阵等。本书希望通过展示常见的Redis应用实例来帮助读者了解使用Redis解决各类问题的方法,并加深读者对Redis各项命令及数据结构的认识,使读者真正成为能够使用Redis解决各类问题的Redis专家。本书适合对Redis有基本了解且想要进一步掌握Redis及键值数据库具体应用的技术人群,是理想的Redis技术进阶读物。 -
一本书讲透数据治理用友平台与数据智能团队本书是数据治理领域公认的标准性著作,能为各种类型企业和机构的数据治理提供全面指导。用友集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评,同时也被中国数据要素高层次人才发展大会(DGBOK)作为指定教材。它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为“3 个战略机制、8 项关键举措、7 种技术能力、7 个治理工具”:数据治理之道:3个战略机制高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制能够帮助企业形成数据治理的自我驱动、自我进化、可持续发展和长效运营机制。数据治理之法:8项关键举措重点讲解了数据治理的8项举措:理现状与定目标、能力成熟度评估、路线图规划、保障体系建设、技术体系建设、策略执行与监控、绩效考核、长效运营。这8项举措构成了企业数据治理的完整实施方法论。数据治理之术:7种技术能力重点讲解了数据治理的7种能力:数据梳理与建模、元数据管理、数据标准管理、主数据管理、数据质量管理、数据安全治理、数据集成与共享。数据治理之器:7个治理工具从功能角度讲解了数据治理所用到的7个工具:数据模型管理工具、元数据管理工具、数据标准管理工具、主数据管理工具、数据质量管理工具、数据安全治理工具、数据集成与共享工具。除此之外,本书还包括两个综合的数据治理案例,以及数据治理的6项准备工作和6个误区。 -
企业级数据架构李杨这是一本能指导企业在数字化转型和数据要素时代通过数据架构用好数据、管好数据、充分发挥数据价值的著作。从0到1讲解了数据架构的技术栈、方法论与落地实践,揭示了数据架构的底层逻辑,总结了数据架构的核心要素和架构模型,阐述了数据治理、数据资产管理以及数据平台的搭建等全方位的内容,是作者10余年数据工作经验的总结。本书主要分为五部分:第一部分:架构基础,对企业架构的组成要素以及流行的企业架构框架进行了总览性质的介绍,数据架构是重点;第二部分:数据架构基础,详细讲解了数据架构的组成、数据存储、数据调度与消息传输、Lambda架构和Kappa架构以及数据架构的辅助资源组件;第三部分:数据架构模型,首先介绍了企业内部数据区的划分与内部数据的流向,然后讲解了数据模型的建模策略、步骤和方法,以及维度建模的详细内容;第四部分:数据管理,讲解了数据架构的核心内容,包括元数据管理、数据质量管理、数据标准管理、数据治理和数据资产管理等的方法和实践;第五部分:数据架构实践,通过离线计算和实时计算两大场景中的综合案例,对前面的内容进行了融合,手把手教读者进行数据架构实践。本书内容通俗易懂,注重实践,不仅浓缩了作者在日常工作中的思考、解决问题的思路,还融入了该领域优秀同行的经验和实践,相信对读者会有一些帮助。 -
数据要素化时代的数据治理上海市静安区国际数据管理协会随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇“新理论、新方法和新技术”介绍数业的逻辑及路径、数据治理的闭环管理方法、数据资产价值的呈现、数据治理的共治共享、精益数据治理,以及数据治理的“新四化”。第三篇“新型数据基础设施”详细介绍来自平安人寿、阿里巴巴和镜舟科技3家企业的数据中台产品的创新情况。第四篇“行业数据治理与数据安全治理”首先介绍高校是如何进行数据治理的,然后介绍数据的安全运营和数据质量问题解决之道。第五篇“企业最佳实践”分享中国石化、中电金信和中国联通3家企业在数据要素化过程中积累的经验。本书适合对数据管理、数据治理、数字化转型等相关主题感兴趣的读者阅读,尤其适合从事相关工作的读者参考借鉴。 -
数据指标体系李渝方这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影响,旨在帮助读者深入理解数据指标与实际业务的底层关联,把数据指标体系落地到业务中。第一篇(第1章):深度解读数据指标体系的基础知识,让读者充分理解数据指标,并掌握构建策略、全流程和方法概要,其中包括数据指标体系分类标准、评判优质指标的4个标准、选择数据指标的4个注意事项、数据指标体系3要素、构建指标体系的7个策略等重点。第二篇(第2~6章):从实践层面出发,带领读者基于业务目标一步步提炼5类产品(工具类、内容类、社交类、交易类、游戏类)的关键数据指标,并通过精细的维度拆解,呈现清晰的指标规划图谱。本篇还在最后站在分析维度的角度给出了数据指标分析的方法论。第三篇(第7章和第8章):在第二篇形成的规划图谱的基础上,给出数据指标构建的完整方法论,并以在线教育、电子书阅读工具、图文内容社区、网约车平台、社交电商这五大典型行业为例,完整解读如何将方法论应用于实践。第四篇(第9章和第10章):揭秘数据从埋点收集到清洗加工的全过程,包括原始数据采集、数据处理与指标开发、数仓模型构建等。这是实现高效数据处理的关键,也是数据分析师技能之一。第五篇(第11章和第12章):通过实际案例指导读者搭建数据指标体系,并展示如何利用数据指标体系监控业务动态,分析数据异动,量化其对整体业务的影响。其中包括25种BI数据可视化方法、2个监控看板实战案例、精准定位数据异动的方法、4种数据异动类型、1套异动维度拆解策略,以及7种量化数据异动贡献度的方法。 -
数据认责[美]大卫-普罗特金本书提供了关于如何在数据治理中建立和运行数据认责工作的适用且可操作的信息和说明,旨在为新任数据专员或数据治理经理提供在数据认责方面所需的知识,以确保其工作有效和高效。本书分为11章,包括:数据认责和数据治理:二者如何结合;了解数据认责的类型;认责管理的角色和职责;实施数据认责;培训业务型数据专员;数据认责实践;数据专员的重要角色;衡量数据认责进度:指标;数据认责成熟度评估;大数据和数据湖认责;基于数据域开展数据治理和认责。本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和进阶用书,还可作为数据治理、信息技术、数据分析等领域人员的参考用书,尤其适合对数据认责感兴趣的读者和负责组织以及运行数据认责工作的人员阅读。 -
OLAP引擎底层原理与设计实践高英举 许一腾这是一本从OLAP核心概念出发,以Presto为例,从整体执行流程到不同SQL的执行原理,完整呈现OLAP查询的核心流程和OLAP引擎设计思路,并指导读者形成OLAP引擎设计解决方案的专业技术工具书。本书不仅面向初级读者介绍了OLAP查询的基本原理和Presto使用方法,还从源码级剖析了OLAP引擎核心原理,包括SQL查询解析器、优化器、调度器、执行器等核心组件,并将内容扩展到OLAP引擎的常见高性能优化方案上。全书由浅入深,图文并茂,把晦涩难懂的内容讲解得透彻易懂。本书分为6篇,包括14章。第一篇(第1章和第2章)总体介绍业界常见的OLAP引擎并分析其优劣,讨论OLAP引擎的技术发展趋势及选型方法,介绍Presto背景知识及其使用方法、技巧。第二篇(第3章和第4章)串讲OLAP查询执行的整个过程,并概要性介绍查询解析器、优化器、调度器、执行器等核心模块的工作原理,目的是让读者形成整体认知。第三篇(第5~8章)以例讲理,对多种经典SQL的执行原理进行解析,复杂度从前到后逐章递增,包含了投影变换、过滤、行数限定、排序以及多种聚合场景。第四篇(第9章和第10章)详解分布式查询执行的数据交换机制,涵盖了查询规划、调度、执行的多个阶段等重点内容。第五篇(第11章和第12章)以Presto为例整体介绍流行的OLAP引擎扩展机制——插件体系与连接器。第六篇(第13章和第14章)主要介绍函数的设计原理与开发实战,这部分首先介绍函数注册、解析识别、调用等重要流程,最后从标量函数、聚合函数两方面入手,用多个实际案例介绍高级API(注解框架)的开发方法以及低级API的底层开发方法。 -
基于低维模型的高维数据分析[美]约翰·莱特, 马毅本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。 -
大模型工程化腾讯游戏数据团队大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、实时数据写入和高效数据分析等内容。第3部分主要介绍大模型下的数据资产,围绕数据资产重塑、数据资产标准、数据资产建设、数据资产运营展开。第4部分主要介绍自研领域大模型的技术原理,涵盖领域大模型的基础、需求理解算法、需求匹配算法、需求转译算法等内容。第5部分主要介绍大模型的工程化原理,涉及工程化的基础、技术筹备、建设要点、安全策略等内容。第6部分介绍大模型在游戏领域的应用,通过游戏领域的经营分析案例,系统地阐述如何实现业务需求。本书适合致力于大模型技术应用的数据工程师阅读,也适合寻求AI自动化编程解决方案的软件开发者阅读,还适合希望利用AI提升业务效率的企业决策者阅读。
