数据库
-
ClickHouse入门、实战与进阶陈光剑 著本书是ClickHouse领域的集大成之作,从基础知识、实现原理、项目实战、扩展应用4个维度全面展开,表述简练清晰、案例丰富实用,既可以作为入门的标准参考书,又适合作为案头速查手册。书中内容是作者在阿里巴巴、字节跳动多年实战经验的总结,得到了字节跳动和阿里巴巴9位大数据专家的高度评价。全书共10章,主要内容如下:第1~3章整体介绍ClickHouse概念、特性、应用场景、技术生态、快速入门和基础数据类型等基础内容,目的是从本质上揭开ClickHouse高性能背后的秘密,帮助读者快速上手实践。第4~6章重点讲解ClickHouse的高级数据类型、函数和SQL查询语法与配置实践等进阶内容,通过该部分内容的阅读和学习,你将全面掌握ClickHouse核心功能的使用方法和技巧。第7~10章从企业级项目实战的角度出发,详细解析ClickHouse在实际业务项目中的使用,主要包括基于Spring Boot开发ClickHouse SQL查询工具、基于ClickHouse Bitmap实现DMP用户画像标签圈选人、基于ZooKeeper搭建ClickHouse分布式集群、基于Grafana搭建ClickHouse集群监监控平台等相关内容。通过该部分内容的阅读学习,你将掌握ClickHouse企业级项目实战开发的方方面面。本书非常注重实用性和实战性,不仅在各个知识点都辅有大量的实际案例、图表说明和小贴士,而且还有多个综合性的项目案例贯穿全书。
-
深入浅出数据分析(美)Michael Milton(迈克尔.米尔顿)《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、关系数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要诀、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。本书通过精心设计的实践场景,让读者不由自主地代入角色当中,真正在体验中学习、思考,将数据分析的要点融化于心,自如地应用在工作和生活中。
-
GeoMesa时空数据管理刘钧文、梁超、俞自生这是一本专门为智慧城市开发和管理人员打造的GeoMesa学习图书。本书的重点不仅包括宏观的行业环境,还包括对GeoMesa内部原理的剖析,力图帮助读者搭建GeoMesa以及时空数据高效管理的完整知识体系和技能树。本书首先从GeoMesa的历史及上手教程入手。然后,为了加强读者对入门代码中内容的理解,本书对GeoTools的基本概念进行介绍。接着,为了进一步引导读者对时空数据管理建立认知,本书详细阐述GeoMesa核心的时空索引。除了理论方面的介绍,本书还介绍GeoMesa数据写入、数据查询、数据统计、数据分析、数据工作流以及数据存储方案的使用方法和原理,以及GeoMesa对分布式计算的扩展。后,作者针对实际操作时遇到的典型问题,给出详细的解决方案。
-
大数据资源规划理论与统筹发展研究周耀林,常大伟 著大数据资源规划与统筹发展是新技术背景下提出的重大命题。本书围绕这一重大命题,将大数据置于国家战略高度,详细阐述了大数据资源规划理论模型,以及如何建设大数据资源规划与统筹发展保障体系。本书作为专著,具有很强的专业型、理论性和时代性,本书以“大数据资源规划理论与统筹发展研究”为主题,以规划理论与应用为切入点,形成大数据资源规划理论,建立大数据资源规划模型,理顺基于规划的大数据资源统筹发展路径,并以面向公共文化服务的大数据资源规划与统筹发展应用为案例进行剖析,促进大数据资源的多场景综合应用、服务大数据政策规划的制定和国家大数据战略的实现。
-
企业级大数据项目实战张伟洋《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍“企业级大数据用户搜索行为分析系统”的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解“用户行为数据采集模块”的开发,第4章讲解“用户行为数据离线分析模块”的开发,第5章讲解“用户行为数据实时分析模块”的开发,这3章采用项目导向的方式,让读者参与实际开发过程;第6章讲解“数据可视化模块”的开发,并整合各模块,测试数据流转,完成项目的开发与部署。 《企业级大数据项目实战:用户搜索行为分析系统从0到1》项目源自真实业务场景,目的是使读者通过实际项目来理解理论知识并提高实践能力。本书适合缺乏大数据项目经验的从业者阅读,也适合作为高等院校大数据专业的教学用书。
-
SQL语言从入门到精通明日科技《SQL语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了在开发中使用SQL语言必须掌握的技术。全书分为3篇共18章,内容包括SQL语言基础、SQL查询基础、复杂查询、数据排序、SQL函数的使用、分组统计、子查询、多表查询、添加数据、修改和删除数据、视图、存储过程、触发器、游标、索引、事务、管理数据库与数据表、数据库安全。所有知识都结合具体实例进行介绍,涉及的程序代码给出了详细的注释,读者可以轻松领会SQL语言的精髓,快速提高开发技能。
-
Pandas数据分析[美]斯蒂芬妮·莫林 著,李强 译《Pandas数据分析》详细阐述了与Pandas数据分析相关的基本解决方案,主要包括数据分析导论、使用Pandas DataFrame、使用Pandas进行数据整理、聚合Pandas DataFrame、使用Pandas和Matplotlib可视化数据、使用Seaborn和自定义技术绘图、金融分析、基于规则的异常检测、Python机器学习入门、做出更好的预测、机器学习异常检测等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
-
SQL Server从入门到精通明日科技《SQL Server从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQL Server开发所必需的各方面技术。全书分为4篇共19章,内容包括数据库基础、SQL Server数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中的事务、维护SQL Server数据库、数据库的安全机制、Visual C SQL Server实现酒店客房管理系统、C# SQL Server实现企业人事管理系统和Java SQL Server实现学生成绩管理系统。所有知识都结合具体实例进行介绍,涉及的程序代码给出了详细的注释,读者可以轻松领会SQL Server 2022的精髓,快速提升开发技能。
-
互联网广告系统唐溪柳这是一部从工程实践角度讲解互联网广告系统的业务价值、产品形态、架构设计、技术选型、落地方法论、实施路径和行业案例的著作,是作者在Google和腾讯从事广告系统架构设计与工程实现的10余年经验总结。通过本书,你将掌握以下内容:(1)互联网广告的生态和产品形态首先介绍了谷歌、Meta、亚马逊、微软等主要在线广告平台;然后介绍了主要在线广告网络和程序化购买生态;蕞后介绍了在线广告产品形态,包括在线广告的投递方式和计费方式。主要目的是帮助读者建立对互联网广告生态的宏观认知。(2)广告投放系统的架构与设计结合Facebook Marketing、Google Ads、Twitter Ads等广告平台讲解了广告投放系统,主要内容包括广告的层级结构、三个广告平台API的特点及用法演示,以及API的基本设计原则和设计方法论。读者可以从本章中学到现代广告系统投放子系统的设计思想。(3)广告系统的设计方法论互联网广告系统的规模往往比较大,详细介绍了以分布式系统为代表的大规模网络系统的架构设计方法论,为读者设计广告系统打下基础。(4)广告系统的工程架构详细讲解了广告播放系统的架构设计、广告系统的数据架构设计、广告系统中的A/B测试等。(5)广告策略系统的架构设计首先介绍了广告竞价原理和广告策略系统设计;然后讲解了广告系统预估子系统,包括预估模型数据处理、常用的模型评价方法与指标、常用的模型训练方法,以及新广告点击率预估和转化率预估。本书系统阐述了互联网广告系统设计的方方面面,对广告系统、推荐系统、大数据系统的建设具有很高的参考价值。
-
Apache Spark大数据分析[瑞典]罗伯特·伊利杰森(Robert Ilijason)Azure Databricks是一款基于云的大数据分析和机器学习平台,用于实现基于Apache Spark的数据处理,为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。《Apache Spark大数据分析:基于Azure Databricks云平台》详细介绍基于Azure Databricks云平台来使用Apache Spark完成大规模数据处理和分析的方法。本书总计11章,首先介绍大规模数据分析相关的概念;然后介绍受管的Spark及其与Databricks的关系,以及Databricks的版本差异和使用方法(涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容);接着介绍使用SQL和Python分别实现数据分析的过程,数据提取、变换、加载、存储、优化技巧等高阶数据处理方法以及外部连接工具、生产环境集成等内容;后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。作为数据分析领域的入门书,本书具有很强的实用性,可供数据工程师、数据分析师和决策分析人员等学习和参考。