数据库
-
向量数据库梁楠《向量数据库:大模型驱动的智能检索与应用》系统地介绍向量数据库的原理、技术实现及其应用,重点分析传统数据库在处理高维向量数据时的局限性,并提供相应的解决方案。《向量数据库:大模型驱动的智能检索与应用》分为4个部分,共13章,内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,并特别强调企业级语义搜索系统的开发与部署经验。《向量数据库:大模型驱动的智能检索与应用》不仅提供深度的理论指导,还通过丰富的案例帮助读者掌握如何构建高效的向量搜索引擎,适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者,也可作为培训机构和高校相关课程的教学用书。 -
原理、优化与架构设计董菲 包光磊 王岩广 黄偲韡本书以TiDB数据库为基础介绍分布式数据库的运行原理、性能优化和应用场景架构设计。首先,剖析分布式数据库的运行原理与架构;然后,阐述分布式数据库TiDB在表与索引的设计优化、SQL优化、系统级优化方面的方法论,通过融入多个有代表性的案例,帮助读者将方法论对应到生产实践中;最后,梳理场景选型和架构设计过程中读者应该掌握的主要知识点,并对一些分布式数据库的优势场景进行了详细介绍。本书适合希望了解分布式数据库原理,学习TiDB数据库的开发工程师、数据库管理员和架构师阅读,也可以作为高等学校教师或学生学习分布式数据库的参考教材。 -
数据结构俞勇、张铭、陈越、韩文弢本书是计算机领域本科教育教学改革试点工作(“101计划”)系列教材之一,秉承“发展经典,关注前沿;问题先导,内容溯源;章节灵活,难度适配”原则编写而成。全书共16章,包括绪论,线性表,栈与队列,字符串,树与二叉树,优先级队列,图,图应用,不相交集,内排序,查找与高级查找,外排序,查找与索引,算法基础,高级算法。本书提供配套教学课件、各章知识点教案、各章引入视频、配套实验教材(C、C++、Java、Python等语言实现),以及实践教学平台等教学资源,可作为高等学校计算机类专业本科生“数据结构”课程教材。 -
轻松拿捏大数据算法面试杨国栋 徐扬 徐振超 等内容简介这是6位来自多个大厂的大数据工程师联合力扣撰写的,深度解读大数据算法面试母题的求职手册。本融合了几位作者总计数百次面试他人和被他人面试的经验,结合对大厂招聘的真实需求,深度解读精选自力扣的近百道具有代表性的算法题。这些题目覆盖了几乎所有大数据从业者需要掌握的算法题类型,它们有的来自力扣多年的专业沉淀,有的来自各家企业的真实招聘题库。各位作者从实际应用场景出发,解读每道题出现在面试中的底层逻辑,然后给出具体的解题思路和编程示例,并从时间复杂度和空间复杂度两个层面分析示例程序。第1章和第2章从数据结构这个层面解读数组、链表、字符串、哈希表、栈、队列、树和图,这是所有算法的基础,然后深入分析了排序、递归、分治、贪心、回溯算法以及动态规划等基础算法的母题。第3章和第4章则聚焦大数据领域,从计算与存储两个维度解读面试中常见的算法题,比如Top k问题、中位数问题、位图算法问题、有序哈希字典问题、树存储问题、索引设计问题、海量数据写入与存储问题等。第5章和第6章精选了多道来自真实面试的算法题进行精讲,并从如何高效刷题、如何准备面试两个层面给出精准指导。 -
商业分析桑吉瓦·加吉亚,凯文·勒瓦差拉,艾利森·本书针对高校商学院商业分析课程编写,内容涵盖了所有相关的商业分析主题,而且各个主题在设计上都是模块化的,教师授课时可灵活地选择最符合其课程目标的主题。比如,本书可以适用于涵盖数据处理(第2章)、数据可视化(第3章)、综合指标(第3章)、统计理论(第4章和第5章)和回归分析(第6章和第7章)的入门课程,或侧重于预测(第8、9、10、11和12章)和预测性建模(第13章)的高级商业分析课程。为适应不同学生对于统计软件的需求,本书每个知识点都提供了Excel和 R语言两种分析方法和实际操作,而且所有的例题和习题都是使用撰写本书时最新版本的软件解决的,即Microsoft Office Professional 2016、Analytic Solver 2019和 R语言3.5.3版本。本书的最终目的是让学生更好地理解、管理和可视化数据,学会应用适当的分析工具,并对研究结果及其相关性进行沟通。 -
数据驱动的供应链金融冯天驰 姜桂林 唐丽华 李邕内容介绍这是一本指导供应链金融相关企业做好数据工作,并利用数据驱动供应链金融产品和服务的设计与运营的著作。在数据要素赋能各行各业的大背景下,传统供应链金融产品和服务过于依赖模式设计和经验判断的问题,通过数据驱动的方法能得到很好的解决。本书将详细指导供应链金融相关企业做好数据实施工作,并将数据成果应用到供应链金融产品和服务的设计与运营工作中,提供科学的方法论和标准的操作流程。本书共12章,从逻辑上可以分为四个部分。第一部分:总体概述(第1~3章)该部分阐述了本书所述的供应链金融的范围、参与方、数据工作的目标与内容、工作团队组成等。第二部分:数据实施工作(第4~7章)该部分包括业务调研和信息系统调研、构建数据基础、市场分析测算、风险分析等内容,阐述了确定数据、整合数据、分析数据及最终形成结论的过程,是全书的重点和难点。其中,金融企业了解、整合和运用核心企业供应链数据的过程,需要双方明确分工、密切配合、共同完成工作。第三部分:数据成果运用(第8~11章)该部分包括风险规则形成与系统实现、对接核心企业数据、供应链金融产品设计、数据运营等内容。这些工作主要是站在金融企业的角度进行阐述,核心企业处于配合地位。第四部分:知识沉淀(第12章)该部分阐述如何更好地实现知识沉淀和标准工具建设。类似项目经验、资料和管理方法这样的知识和工具均具有长期效应,有助于金融企业不断沉淀知识,提升效率,形成竞争优势。 -
数据资产入表与数据交易合规指南江翔宇内容简介这是一部立足于当下行业实践和政策指引,从工作程序和实体法律角度,对企业数据资产入表的基本内涵、具体流程、数据交易与入表工作的合规要点进行分析归纳的专著,旨在通过深入浅出的分析帮助读者实现在数据交易、数据资产入表领域的快速认知同步。作者曾经在金融监管部门、金融机构和头部互联网平台工作,是国内较早开展数据领域法律实践的律师,曾经为众多企业在场内进行数据交易的产品提供合规评估,为多个大型数据平台企业和金融机构提供数据合规、金融科技的法律服务,包括个人信息合规自评估、证券业跨行业数据共享监管沙盒项目、垂类大模型合规项目等,具有丰富的法律实践和研究深度、广度。全书共12章,主要内容如下:第1和2章数据要素市场与数据资产入表的内涵介绍首先,从数据要素市场出发对国家层面的政策和法律沿袭进行了梳理与分析,对国家顶层设计文件“数据二十条”的主要内容进行了介绍;然后,对数据资产入表的内涵和意义以及各个相关概念进行比较分析;最后,对数据资产入表的具体操作进行简明扼要的解读,帮助读者透彻理解数据要素市场和数据资产入表的底层逻辑。第3~6章数据资产入表的重点合规问题及入表准备首先,对数据资产入表与数据确权的关系进行了深入分析,明确了权属清晰对数据资产入表的底层重要性;然后,对确权相关的合规问题以及其他涉及数据资产入表的合规问题进行了深入分析,厘清了关键合规要点,特别是数据来源的合规性;最后,对数据资产入表的准备工作和主要路径进行了介绍和梳理,帮助读者迅速掌握操作思路和落地路径。第7~10章数据资产入表的数据分类合规重点就数据资产入表在主要领域的开展难点进行分析,并就上市公司和非上市公司的具体案例进行分析,给出启示。具体分为数据资产入表与公共数据、数据资产入表与个人数据、数据资产入表与人工智能三个部分,分别从数据资产入表角度对各自的合规难点、立法现状、未来展望加以深入浅出的剖析。第11章数据资产入表衍生金融化利用的思考与展望就数据资产化之后的数据资本化,即数据资产入表的金融化利用问题进行了积极而冷静的分析与思考。首先对金融意义下的数据资产管理内涵进行了分析,然后对目前数据资产的金融化探索与实践进行了分析,对其中的法律难点问题进行归纳,并对普遍性开展的难点进行分析和展望。第12章数据资产入表与数据交易首先,对数据资产入表与数据交易之间的紧密联系进行分析;然后,对数据交易的概念、内涵以及法律性质进行分析,并对场内数据交易和场外数据交易进行比较分析;最后,对数据交易中的合规性审查要点进行分析归纳。 -
Kubernetes设计模式[英] 比尔金 伊卜亚姆(Bilgin Ibryam) [德] 罗兰·胡贝塔(Roland Hu?)本书主要内容包括:基本模式篇介绍构建以及运行基于容器的云原生应用程序的核心原则与实践。行为模式篇介绍各类容器和平台交互的管理。结构化模式篇介绍通过组织容器解决特定的用例。配置模式篇介绍如何处理Kubernetes中应用程序的配置。安全模式篇介绍如何提高运行在Kubernetes之上的应用程序的安全性。高级模式篇涵盖更复杂的主题,例如操作器、自动伸缩以及集群内镜像构建等。 -
数据认责[美]大卫-普罗特金本书提供了关于如何在数据治理中建立和运行数据认责工作的适用且可操作的信息和说明,旨在为新任数据专员或数据治理经理提供在数据认责方面所需的知识,以确保其工作有效和高效。本书分为11章,包括:数据认责和数据治理:二者如何结合;了解数据认责的类型;认责管理的角色和职责;实施数据认责;培训业务型数据专员;数据认责实践;数据专员的重要角色;衡量数据认责进度:指标;数据认责成熟度评估;大数据和数据湖认责;基于数据域开展数据治理和认责。本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和进阶用书,还可作为数据治理、信息技术、数据分析等领域人员的参考用书,尤其适合对数据认责感兴趣的读者和负责组织以及运行数据认责工作的人员阅读。 -
城市计算郑宇本书概述了城市计算的定义、框架和主要研究问题,以典型应用为案例着重介绍大数据中异构数据的融合和协同计算技术。
