数据库
-
Trino权威指南[美]马特·富勒,[奥]曼弗雷德·莫泽,[美]马丁·特拉韦尔索 著本书详细介绍了开源的分布式SQL查询引擎Trino涉及的方方面面的知识。本书共三部分,第一部分介绍Trino的发展历史、主要功能以及如何安装和使用它,第二部分介绍Trino的内部架构、部署、连接器和所支持的SQL语句的使用等,第三部分介绍在生产环境中部署Trino的知识,以及一些真实世界的部署案例。通过学习本书,你将了解Trino在解决海量数据分析和查询问题方面的优越性,并学会在现实场景中使用它来高效地解决需要在短时间内返回结果的大数据查询问题。
-
Hadoop HDFS深度剖析与实践祝江华 编著本书以Hadoop HDFS为载体,介绍了构建一款分布式系统(尤其是存储方向)所需的核心技术,所有内容均基于当前较新的3.3.x/3.4.x版本,分别从理论和实践两个维度逐一阐述。本书主要包括两篇:核心原理篇介绍了HDFS的诞生历史、元数据及Block管理、节点间通信机制、读写数据流程和高可用实现原理等;拓展与实践篇从实际出发,充分考虑了用户在应用过程中会遇到的痛点,详细介绍了集群拓展方法、数据分层存储、集群维护与多租户实施等实践经验。本书各章节都配有必要的流程图和原理分析图,便于读者阅读理解,并精选了非常有用的实际案例及拓展知识。阅读本书后,相信会给读者带来“1 1>2”的效果。本书非常适合大数据从业者、云计算领域研发及运维人员、高校研究生和热衷于分布式的技术极客阅读学习。
-
开放协同的科技大数据汇聚融合与演化分析陈浩等《开放协同的科技大数据汇聚融合与演化分析》针对科技服务对科技资源数据汇聚融合的需求,研究面向开放协同的科技大数据汇聚融合和演化分析技术,研究多源异构科技大数据资源体系建设与应用场景,设计科技大数据汇聚融合与演化分析系统架构,利用在线知识图谱建立多源异构、碎片化数据之间的语义关联和多粒度层次语义映射,完成科技大数据的实体识别和匹配,向各行业各领域用户提供面向开放协同的科技大数据检索服务。基于区块链技术实现科技大数据的可信数据确权与追踪保护,实现数据生命周期管理。
-
大数据资源规划理论与统筹发展研究周耀林,常大伟 著大数据资源规划与统筹发展是新技术背景下提出的重大命题。本书围绕这一重大命题,将大数据置于国家战略高度,详细阐述了大数据资源规划理论模型,以及如何建设大数据资源规划与统筹发展保障体系。本书作为专著,具有很强的专业型、理论性和时代性,本书以“大数据资源规划理论与统筹发展研究”为主题,以规划理论与应用为切入点,形成大数据资源规划理论,建立大数据资源规划模型,理顺基于规划的大数据资源统筹发展路径,并以面向公共文化服务的大数据资源规划与统筹发展应用为案例进行剖析,促进大数据资源的多场景综合应用、服务大数据政策规划的制定和国家大数据战略的实现。
-
智能化海洋物联网中国船舶集团有限公司系统工程研究院组 编,甄君、张驰、赵金红 著本书介绍了智能化海洋物联网云服务体系架构、云服务模式以及基于云服务的海洋物联网典型业务应用。本书以智能化海洋物联网应用系统关键技术研究与应用示范项目为支撑,通过科研实践,将海洋物联网与云计算技术融合运用,构建了智能化海洋物联网云服务体系,拓展了海洋物联网ICT资源共享和云服务模式。其中,在资源共享内容中将海洋物联网感知设施、通信设施与云计算设施统筹运用,提供了泛在的海洋物联网基础设施即服务(IaaS);在云计算服务内容中根据海洋物联网业务应用需求,提供了更为丰富的服务模式,包括海洋物联网跨域通信服务,简称通信即服务(CaaS);岸海孪生数据服务,简称数据即服务(BaaS);基于区块链技术的海洋信息安全服务,简称区块链即服务(BaaS)等多种服务。本书能够为海洋信息化领域相关研究提供一定的帮助,也能为海洋工程建设提供一定的支撑。
-
文本数据挖掘宗成庆、夏睿、张家俊文本数据挖掘是通过机器学习、自然语言处理和推理等相关技术或方法,理解、分析和挖掘文本的内 容,从而完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。《文本数据挖掘(第2版)》主 要介绍与文本数据挖掘有关的基本概念、理论模型和实现算法,包括数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分析与观点挖掘、话题检测与跟踪、信息抽取以及文本自动摘要等,后通过 具体实例展示相关技术在实际应用中的使用方法。《文本数据挖掘(第2版)》书可作为高等院校计算机、自动化、网络安全、大数据分析等专业,以及利用到文本信息处理的交 叉学科(如金融财经、社会人文、生物医药等)的高年级本科生或研究生从事相关研究的入门参考书,也可供相关技术研发人员阅读和参考。
-
图解大数据分析渡部徹太郎 著本书通过大量的绘图和详细的说明,从技术层面以简单易懂的形式讲述大数据分析。这是一本从系统结构搭建到实际开发逐步推进的教科书。书中的知识点包括大数据分析时所需的分布式处理、机器学习,以及分布式存储、分布式计算、开发时可能遇到的瓶颈,还包括大数据的收集、积累、活用以及元数据的使用与管理等。本书适合大数据领域的广大爱好者、商务人士和工程技术人员用于了解、学习、掌握、运用大数据技术进行大数据分析,也适合作为该领域的职业院校和高校本科相关专业的教材及研究生辅助教材。
-
SQL实践教程[美]马克·谢尔曼,哈桑·阿夫尤尼本书介绍了SQL的编程原理、基本原则、使用方法及技巧,包含数据库设计基础知识,第一范式、第二范式、第三范式的概念和范式间的转换方法,涉及数据库创建、单表查询、多表查询、更新数据、数据库管理知识,并提供了常用SQL语句的案例速查表。公司使用SQL来管理订单、物品、客户和销售代表的有趣案例贯穿全书,方便读者跟随进度逐步上手SQL。本书可作为高等院校SQL或数据库相关课程的参考教材,也可作为SQL的案例参考和函数速查手册,适合有一定编程基础、想要上手使用SQL的人阅读。
-
科技大数据的建模与分析技术周向东,刘德兵,王元卓,王尧科技大数据的建模理论与分析方法是科技大数据相关技术研究与服务平台建设的重要理论基础和应用方法论。科技大数据主要由非结构化和复杂结构数据组成,涉及广泛而丰富的建模理论和方法。本书内容侧重面向科技大数据应用的基于张量的非结构数据建模、知识图谱及迁移学习等的基本概念及理论,同时介绍相关理论在认知图谱、跨域图像分类以及学者研究兴趣及机构合作关系挖掘等方面的应用。
-
深入浅出DAX黄福星本书系统的阐释Power Pivot for Excel及Power BI中DAX语言的应用。本书是基于笔者多年的DAX学习与使用经验的基础上所采用的一种全新布局与讲解方式,整书依据读者易于理解的方式,由浅入深进行循序渐进式的讲解。本书要探索的重点是,如何利用简捷的办法,让读者在一至两个月之内轻松、系统、全面地掌握DAX语言。 全书共分为5篇:篇为入门篇(第1章和第2章),第二篇为基础篇(第3~5章),第三篇为强化篇(第6章和第7章),第四篇为进阶篇(第8~10章), 第五篇为案例篇(第11章)。书中主要内容包括DAX基础、表的基础应用、查询表、计算列、迭代行、度量值、时间智能、Power BI简介、筛选调节、DAX高阶、综合案例。 本书是为非计算机专业及非统计学专业想快速掌握DAX数据分析及商业智能而准备的。另外,本书也适用于财务、人事行政、电商客服、质量统计等与数据分析密切相关的从业人员,也可作为高等院校、IT培训机构、其他编程爱好者的参考用书。