计算机/网络
-
数据工程之道[美]乔·里斯,[美]马特·豪斯利本书介绍了数据工程生命周期,并展示如何组合运用各种云技术来满足下游数据消费者的需求。本书分为三部分:第一部分介绍了数据工程的定义、数据工程的生命周期、合理的架构设计和帮助技术选型的框架;第二部分深入介绍了数据工程生命周期的每个阶段——数据生成、存储、获取、转换和服务;第三部分讨论了数据工程的重要部分——安全和隐私。附录还介绍了与处理数据文件和评估数据系统的性能有关的序列化和压缩,以及云网络。本书适合软件工程师、数据科学家、数据工程师和数据分析师等相关技术人员阅读。 -
原理、架构和代码分析王凤刚在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的“全景图”。本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者和学者,也可作为高校计算机类专业的分布式数据库相关课程的参考资料。 -
数据结构俞勇、张铭、陈越、韩文弢本书是计算机领域本科教育教学改革试点工作(“101计划”)系列教材之一,秉承“发展经典,关注前沿;问题先导,内容溯源;章节灵活,难度适配”原则编写而成。全书共16章,包括绪论,线性表,栈与队列,字符串,树与二叉树,优先级队列,图,图应用,不相交集,内排序,查找与高级查找,外排序,查找与索引,算法基础,高级算法。本书提供配套教学课件、各章知识点教案、各章引入视频、配套实验教材(C、C++、Java、Python等语言实现),以及实践教学平台等教学资源,可作为高等学校计算机类专业本科生“数据结构”课程教材。 -
图数据实战[美]丹妮丝·柯斯勒·戈斯内尔,[美]马蒂亚斯·布罗谢勒本书是一本探索如何应用图思维和图技术解决复杂问题的书籍。该书针对有兴趣学习如何使用图数据提升工作水平、解决困难问题的实战从业者。该书涵盖了与图数据相关的广泛主题,包括图思维、图数据模型和查询语言,讨论了如何将图数据应用于社交网络、物流和网络安全等领域的问题解决方案。此外,该书还提供了实践指导,包括工具和框架的推荐、设计有效图数据模型的建议,以及如何使用图数据生成洞见和做出明智决策的建议。总的来说,本书是任何希望学习如何使用图数据解决复杂问题和获得新的工作洞见的人的优质资源。 -
数据治理石秀峰 李晓燕 赵佳本书是一本数据治理领域的实战型手册,共8章,内容包括:数据治理的基本概念、数据治理的价值、数据治理的核心职能、实施数据治理的前提、实施数据治理的五个阶段、数据治理的十大核心能力建设、数据治理工具与技术、数据治理行业实践案例。本书语言通俗易懂,体系完整,案例丰富,系统全面地介绍了数据治理的目标、价值、方式、方法、工具等相关知识,可以帮助读者快速理解数据治理的概念,认识数据治理的架构,掌握数据治理的基本方法。本书读者对象主要是CEO、CDO、CIO、CTO,以及数据治理、企业数字化转型领域的相关管理者和项目负责人。本书也适合作为高校数字经济、数据科学与大数据技术、大数据管理与应用等专业的数据治理相关课程教材。 -
商业分析桑吉瓦·加吉亚,凯文·勒瓦差拉,艾利森·本书针对高校商学院商业分析课程编写,内容涵盖了所有相关的商业分析主题,而且各个主题在设计上都是模块化的,教师授课时可灵活地选择最符合其课程目标的主题。比如,本书可以适用于涵盖数据处理(第2章)、数据可视化(第3章)、综合指标(第3章)、统计理论(第4章和第5章)和回归分析(第6章和第7章)的入门课程,或侧重于预测(第8、9、10、11和12章)和预测性建模(第13章)的高级商业分析课程。为适应不同学生对于统计软件的需求,本书每个知识点都提供了Excel和 R语言两种分析方法和实际操作,而且所有的例题和习题都是使用撰写本书时最新版本的软件解决的,即Microsoft Office Professional 2016、Analytic Solver 2019和 R语言3.5.3版本。本书的最终目的是让学生更好地理解、管理和可视化数据,学会应用适当的分析工具,并对研究结果及其相关性进行沟通。 -
动力学刻画的数据科学理论和方法陈洛南等本书旨在建立和推动“动力学刻画的数据科学”理论和应用研究。全书共六章,内容包括:复杂动力系统理论基础、高维数据的临界预警理论及方法、短时间序列的预测理论及方法、动力学因果检测理论及方法、基于动力学的势能景观构建理论及方法、混沌反馈学习理论及深度学习方法等。全书交叉融合了数学理论、统计学方法、人工智能、计算系统生物学方法等知识,做到数学理论与实际应用并重,动力学算法与统计学方法互补,内容图文并茂、清晰易读、由浅入深,并在第2章至第6章末尾配有相关前沿领域的展望与讨论,读者可以通过阅读本书了解所涉及研究方向的发展趋势。 -
AIGC辅助数据分析与挖掘宋天龙内容简介这是一本能指导数据分析师和数据挖掘工程师在AIGC时代快速实现能力跃迁的著作,教会他们使用ChatGPT等AIGC工具,大幅提升数据分析与挖掘的能力和效率。全书围绕Excel、SQL和Python这3大常用的数据分析和挖掘工具展开,从方法和实践2个维度系统讲解了如何使用ChatGPT和Bing Copilot等AIGC工具来辅助提升效率。全书一共8章,内容可以分为四个部分:1.AIGC工具使用和Prompt撰写首先详细介绍了数据分析与挖掘能用到的各种AIGC工具的使用方法和注意事项,然后全面讲解了如何面向数据分析与挖掘场景构建高质量的Prompt,包括大量的方法和最佳实践。2.AIGC辅助Excel数据分析与挖掘方法角度,详细阐述了AIGC工具如何辅助Excel数据分析与挖掘,包括数据集生成、数据管理、数据处理、数据分析和数据展示等;实践角度,通过RFM分析、时间序列分析和相关性分析等3个方面的案例讲解了AIGC工具与Excel在不同场景中的结合使用。3.AIGC辅助SQL数据分析与挖掘方法角度,详细讲解了AIGC工具如何辅助SQL数据分析与挖掘,包括数据准备、查询、清洗、转换、分析等;实践角度,通过广告渠道评估、归因报表、留存报表等3个方面的案例讲解了AIGC工具与SQL在不同场景中的结合使用。4.AIGC辅助Python数据分析与挖掘方法角度,详细讲解了AIGC工具如何辅助Python数据分析与挖掘,包括环境构建、数据探索、数据处理、AutoML等;实践角度,通过广告预测、商品分析和KPI监控等3个方面的案例讲解了AIGC工具与Python在不同场景中的结合使用。除此之外,本书还全面总结了用AIGC辅助这3种数据分析与挖掘工具时会遇到哪些问题以及有哪些注意事项。 -
DolphinDB 从入门到精通之数据分析周小华DolphinDB不仅支持海量数据的高效存储与查询,更开创性地提供了功能完备的编程语言以支持复杂分析,以及高吞吐、低延时、开发便捷的流数据分析框架,是计算能力最强的数据库系统之一。本书从入门概念开始介绍,到实践应用分析,讲解深入浅出、易于理解,是一本具有实践意义的数据分析工具书。本书介绍了如何使用 DolphinDB这一集存储和高性能计算的数据库系统进行数据分析实践,提供了大量金融和物联网等场景的实践案例,读者可以通过借鉴和修改案例中的解决方案,将它们应用于自己的数据分析系统之中。即使是零基础的读者,也能通过学习本书,快速上手实践。 -
数据资产入表与数据交易合规指南江翔宇内容简介这是一部立足于当下行业实践和政策指引,从工作程序和实体法律角度,对企业数据资产入表的基本内涵、具体流程、数据交易与入表工作的合规要点进行分析归纳的专著,旨在通过深入浅出的分析帮助读者实现在数据交易、数据资产入表领域的快速认知同步。作者曾经在金融监管部门、金融机构和头部互联网平台工作,是国内较早开展数据领域法律实践的律师,曾经为众多企业在场内进行数据交易的产品提供合规评估,为多个大型数据平台企业和金融机构提供数据合规、金融科技的法律服务,包括个人信息合规自评估、证券业跨行业数据共享监管沙盒项目、垂类大模型合规项目等,具有丰富的法律实践和研究深度、广度。全书共12章,主要内容如下:第1和2章数据要素市场与数据资产入表的内涵介绍首先,从数据要素市场出发对国家层面的政策和法律沿袭进行了梳理与分析,对国家顶层设计文件“数据二十条”的主要内容进行了介绍;然后,对数据资产入表的内涵和意义以及各个相关概念进行比较分析;最后,对数据资产入表的具体操作进行简明扼要的解读,帮助读者透彻理解数据要素市场和数据资产入表的底层逻辑。第3~6章数据资产入表的重点合规问题及入表准备首先,对数据资产入表与数据确权的关系进行了深入分析,明确了权属清晰对数据资产入表的底层重要性;然后,对确权相关的合规问题以及其他涉及数据资产入表的合规问题进行了深入分析,厘清了关键合规要点,特别是数据来源的合规性;最后,对数据资产入表的准备工作和主要路径进行了介绍和梳理,帮助读者迅速掌握操作思路和落地路径。第7~10章数据资产入表的数据分类合规重点就数据资产入表在主要领域的开展难点进行分析,并就上市公司和非上市公司的具体案例进行分析,给出启示。具体分为数据资产入表与公共数据、数据资产入表与个人数据、数据资产入表与人工智能三个部分,分别从数据资产入表角度对各自的合规难点、立法现状、未来展望加以深入浅出的剖析。第11章数据资产入表衍生金融化利用的思考与展望就数据资产化之后的数据资本化,即数据资产入表的金融化利用问题进行了积极而冷静的分析与思考。首先对金融意义下的数据资产管理内涵进行了分析,然后对目前数据资产的金融化探索与实践进行了分析,对其中的法律难点问题进行归纳,并对普遍性开展的难点进行分析和展望。第12章数据资产入表与数据交易首先,对数据资产入表与数据交易之间的紧密联系进行分析;然后,对数据交易的概念、内涵以及法律性质进行分析,并对场内数据交易和场外数据交易进行比较分析;最后,对数据交易中的合规性审查要点进行分析归纳。
