数据库
-
向量数据库梁楠《向量数据库:大模型驱动的智能检索与应用》系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。《向量数据库:大模型驱动的智能检索与应用》分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。《向量数据库:大模型驱动的智能检索与应用》不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训机构和高校相关课程的教学用书。 -
Kubernetes设计模式[英] 比尔金 伊卜亚姆(Bilgin Ibryam) [德] 罗兰·胡贝塔(Roland Hu?)本书主要内容包括:基本模式篇介绍构建以及运行基于容器的云原生应用程序的核心原则与实践。行为模式篇介绍各类容器和平台交互的管理。结构化模式篇介绍通过组织容器解决特定的用例。配置模式篇介绍如何处理Kubernetes中应用程序的配置。安全模式篇介绍如何提高运行在Kubernetes之上的应用程序的安全性。高级模式篇涵盖更复杂的主题,例如操作器、自动伸缩以及集群内镜像构建等。 -
数据认责[美]大卫-普罗特金本书提供了关于如何在数据治理中建立和运行数据认责工作的适用且可操作的信息和说明,旨在为新任数据专员或数据治理经理提供在数据认责方面所需的知识,以确保其工作有效和高效。本书分为11章,包括:数据认责和数据治理:二者如何结合;了解数据认责的类型;认责管理的角色和职责;实施数据认责;培训业务型数据专员;数据认责实践;数据专员的重要角色;衡量数据认责进度:指标;数据认责成熟度评估;大数据和数据湖认责;基于数据域开展数据治理和认责。本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和进阶用书,还可作为数据治理、信息技术、数据分析等领域人员的参考用书,尤其适合对数据认责感兴趣的读者和负责组织以及运行数据认责工作的人员阅读。 -
城市计算郑宇本书概述了城市计算的定义、框架和主要研究问题,以典型应用为案例着重介绍大数据中异构数据的融合和协同计算技术。 -
数据产品开发与经营钱勇 项灵刚 林建兴 于冰冰 等这是一本讲解在数据要素大背景下,企业如何将数据资源开发成数据产品,进而通过数据产品实现数据资产化和资本化的著作,为企业释放数据价值提供了科学的方法论和国内领先的实践方案。这本书由全球数据资产理事会(DAC)组织编写,融合了国内数据资产管理领域多家企业的10位专家的研究成果和实战经验,得到了湖南数据产业集团、广州数据集团、深圳数据交易所、浙江大数据交易中心、华为、平安、安永、毕马威、德勤、普华永道、浙江大学等企业、机构和高校等近20位高层领导、技术专家和学者的高度评价和一致推荐。从概念到方法,从理论到实践,从产业政策到行业解决方案,本书将为读者构建全面的数据产品知识体系,核心内容如下:(1)国家和地方出台的数据资产相关政策及其解读,为数据资产实践提供法律准绳;(2)详细阐释数据从原始数据到数据资源、数据产品、数据资产,再到数据资本的价值实现路径;(3)原创数据资产运营框架,包含数据战略模块、核心运营模块和基础支持模块,明确了数据产品在整个数据资产运营体系中的作用;(4)系统梳理并厘清原始数据、数据资源、数据资源化、数据资源来源、数据资源存储、数据资源质量、数据资源管理等核心概念及其基础知识;(5)详细介绍数据产品的核心概念、产品类型、产品形态、产品价值;(6)原创数据产品高速动车组模型,重点阐述了价值牵引、场景驱动、合规支撑三大数据产品开发策略;(7)原创数据产品设计五步法,将数据产品设计分为场景设计、价值设计、构件设计、交付与运营、安全合规设计5个步骤;(8)提出数据产品开发全景图,为资源型、服务型、智能型等不同类型的数据产品开发提供科学方法;(9)原创数据产品运营增长框架,为数据产品的运营和增长提供方法论;(10)从实践角度讲解数据产品开发方法如何落地,以及不同类型的数据产品的开发经验;(11)从数据产品交易、数据资产运营和数据资本创新3个维度深度讲解数据产品的经营方法和逻辑,实现从数据产品到数据资本的闭环。 -
大模型工程化腾讯游戏数据团队大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、实时数据写入和高效数据分析等内容。第3部分主要介绍大模型下的数据资产,围绕数据资产重塑、数据资产标准、数据资产建设、数据资产运营展开。第4部分主要介绍自研领域大模型的技术原理,涵盖领域大模型的基础、需求理解算法、需求匹配算法、需求转译算法等内容。第5部分主要介绍大模型的工程化原理,涉及工程化的基础、技术筹备、建设要点、安全策略等内容。第6部分介绍大模型在游戏领域的应用,通过游戏领域的经营分析案例,系统地阐述如何实现业务需求。本书适合致力于大模型技术应用的数据工程师阅读,也适合寻求AI自动化编程解决方案的软件开发者阅读,还适合希望利用AI提升业务效率的企业决策者阅读。 -
公共管理大数据集成平台理论、方法与应用陈晓红等《公共管理大数据集成平台理论、方法与应用》主要介绍了国家自然科学基金重大研究计划集成项目“大数据驱动的公共管理决策创新模式与集成示范平台”的研究成果,内容涵盖公共管理大数据的治理、分析、预测、决策及集成平台构建的理论方法与关键技术,并展示了在公共安全、生态环境和交通运输等领域的应用示范。《公共管理大数据集成平台理论、方法与应用》在理论上提出了大数据驱动下的公共管理智能决策新范式,为学科发展提供了方向;在实践上,有效整合了公共管理领域的数据资源,为解决社会治理与城市管理问题提供了决策参考,并为建成国际水准的公共管理科学数据平台和智库奠定了基础。 -
原理、优化与架构设计董菲 包光磊 王岩广 黄偲韡本书以TiDB数据库为基础介绍分布式数据库的运行原理、性能优化和应用场景架构设计。首先,剖析分布式数据库的运行原理与架构;然后,阐述分布式数据库TiDB在表与索引的设计优化、SQL优化、系统级优化方面的方法论,通过融入多个有代表性的案例,帮助读者将方法论对应到生产实践中;最后,梳理场景选型和架构设计过程中读者应该掌握的主要知识点,并对一些分布式数据库的优势场景进行了详细介绍。本书适合希望了解分布式数据库原理,学习TiDB数据库的开发工程师、数据库管理员和架构师阅读,也可以作为高等学校教师或学生学习分布式数据库的参考教材。 -
数据结构俞勇、张铭、陈越、韩文弢本书是计算机领域本科教育教学改革试点工作(“101计划”)系列教材之一,秉承“发展经典,关注前沿;问题先导,内容溯源;章节灵活,难度适配”原则编写而成。全书共16章,包括绪论,线性表,栈与队列,字符串,树与二叉树,优先级队列,图,图应用,不相交集,内排序,查找与高级查找,外排序,查找与索引,算法基础,高级算法。本书提供配套教学课件、各章知识点教案、各章引入视频、配套实验教材(C、C++、Java、Python等语言实现),以及实践教学平台等教学资源,可作为高等学校计算机类专业本科生“数据结构”课程教材。 -
商业分析桑吉瓦·加吉亚,凯文·勒瓦差拉,艾利森·本书针对高校商学院商业分析课程编写,内容涵盖了所有相关的商业分析主题,而且各个主题在设计上都是模块化的,教师授课时可灵活地选择最符合其课程目标的主题。比如,本书可以适用于涵盖数据处理(第2章)、数据可视化(第3章)、综合指标(第3章)、统计理论(第4章和第5章)和回归分析(第6章和第7章)的入门课程,或侧重于预测(第8、9、10、11和12章)和预测性建模(第13章)的高级商业分析课程。为适应不同学生对于统计软件的需求,本书每个知识点都提供了Excel和 R语言两种分析方法和实际操作,而且所有的例题和习题都是使用撰写本书时最新版本的软件解决的,即Microsoft Office Professional 2016、Analytic Solver 2019和 R语言3.5.3版本。本书的最终目的是让学生更好地理解、管理和可视化数据,学会应用适当的分析工具,并对研究结果及其相关性进行沟通。
