数据库
-
数据工程基础Joe Reis数据工程在过去十年间发展迅速,许多软件工程师、数据科学家和分析师都在寻找相关实践的全面观点。通过这本实践用书,你将学习如何通过评估数据工程生命周期框架中可用的最佳技术来规划和构建系统,以满足你的组织和客户的需求。作者Joe Reis和Matt Housley将为你介绍数据工程的生命周期,向你展示如何综合运用各种云技术,以满足下游数据消费者的需求。你将理解如何应用数据生成、摄取、编排、转换、存储和治理的概念,无论底层技术是什么,这些概念在任何数据环境中都至关重要。 -
中国电子信息工程科技发展研究中国信息与电子工程科技发展战略研究中心当前,大数据不仅是推进网络强国建设的重要领域,更是新时代加快实体经济质量变革、效率变革、动力变革的战略依托。《BR》本书首先简要阐述了大数据的概念、特征和主要发展阶段,并对我国的国家和地方大数据产业政策进行了详细的梳理。在大数据技术章节,按照数据的生命周期对数据采集、存储、计算、管理、应用和安全技术进行了简要的介绍。针对大数据产业,重点从产业发展现状和相关产业主体进行分析。在大数据应用领域,简要介绍了大数据在数字经济、通信、政务、金融、工业等领域的融合应用情况。最后就数据资产、数据要素和大数据法制的发展现状和趋势进行了简要分析和介绍。 -
全球数据跨境流动治理何跃鹰,卓子寒数字经济已成为各国经济增长的新动能,并上升为国家发展战略,各国政府和人民对数据跨境流动安全问题的关注与日俱增。本书系统介绍了全球数据跨境规则的产生背景及其发展演变的脉络,重点分析了全球主要国家和地区数据跨境治理规则的内容和相互之间的异同,特别介绍了欧盟、美国话语权下的数据跨境流动规则及规则间的弥合,也介绍了其他国际性文件及十余个重点国家和地区的立法现状,同时展望了全球数据跨境规则的未来走向,在此基础上对我国的数据跨境流动治理规则现状进行梳理,并对其实施与完善提出了相关建议。本书语言平实易读,主要以法律法规、执法部门的解释性指南、判决书等一手资料作为参考,介绍分析了国内外立法现状和法律实践。 -
SPSS 28.0统计分析基础与应用梁楠本书以SPSS 28.0为平台,由浅入深地全面讲解SPSS软件的相关知识,通过图文并茂的方式讲解各项操作,讲解深入浅出,实例引导,内容翔实,清晰、直观、易学易用。全书分为三部分共17章,详细介绍SPSS的界面、数据文件的编辑、数据文件的整理、基本统计分析、参数估计与假设检验、非参数检验、方差分析、相关分析、回归分析、聚类分析、判别分析、因子分析、对应分析、信度分析、生存分析、时间序列分析、SPSS的综合应用案例等内容。本书涉及面广,涵盖了一般用户需要使用的各种功能,全书按逻辑顺序编排,自始至终结合实例进行描述,内容完整且每章相对独立,是一本详尽实用的SPSS学习用书。 -
OpenShift开发指南[美]约书亚·伍德,[美]布赖恩·坦努斯 著本书解释了什么是OpenShift以及如何使用它来构建应用程序、运行它们,并使它们能够在面对各种复杂情况时保持运行。本书的内容包括:OpenShift及其组件和基本概念;如何运行OpenShift;如何配置OpenShift;OpenShift流水线;如何通过手动和自动的方式检查、操作和扩展正在运行的应用程序,如何设置OpenShift以定期检查应用程序的健康状况,以及如何管理应用程序的新版本发布;OpenShift的监控和告警功能;OpenShift的自动化特性。 -
预测性分析杜尔森·德伦(Dursun Delen)本书全面介绍了预测性分析相关方法,不仅直观地阐述了相关概念,还给出了现实的示例问题和真实的案例研究—包括从失败项目获得的经验教训。本书理论和实践内容相对平衡,便于读者加深理解。全书共9章,外加一个附录。第1章为分析导论,第2章为预测性分析和数据挖掘导论,第3章介绍预测性分析的标准流程,第4章介绍预测性分析的数据和方法,第5章介绍预测性分析算法,第6章探讨预测性建模中的高阶主题,第7章介绍文本分析、主题建模和情感分析,第8章介绍预测性分析使用的大数据,第9章介绍深度学习和认知计算,附录展望了商业分析和数据科学工具的前景。本书适合计算机科学、数据科学和商业分析领域的相关从业人员阅读。 -
实战大数据 分布式大数据分析处理系统开发与应用井超 杨俊 乔钢柱实战大数据——分布式大数据分析处理系统开发与应用,从大数据技术基础概念出发,介绍了大数据分析的流程和大数据分析处理系统的组成,以及大数据集群的搭建,并在此基础上讲解了多种不同技术构成的离线/实时数据分析系统实战项目。全书共10章,包括大数据概述、大数据分析的基本流程与工具、分布式大数据分析处理系统概述、构建大数据集群环境、构建基于LayUI的集群管理系统、基于HBase的大数据离线分析系统、基于Hive+Hadoop+Spark的大数据离线分析系统、基于MySQL+Spark的大数据离线分析系统、基于Redis+Kafka+Spark的大数据实时分析系统、基于Flume+Kafka+Flink的大数据实时分析系统。实战大数据—— 分布式大数据分析处理系统开发与应用,适合从事大数据系统搭建与运维、大数据分析等岗位的技术人员阅读,也适合高等院校大数据相关专业的学生使用。 -
Pandas数据分析快速上手500招罗帅、罗斌本书采用“问题描述+解决方案”模式,通过500个案例介绍了使用Pandas进行数据分析和数据处理的技术亮点。全书共分为8章,主要案例包括:读写CSV、Excel、JSON、HTML等格式的数据;根据行标签、列名和行列数字索引筛选和修改数据,使用各种函数根据数据大小、日期范围、正则表达式、lambda表达式、文本类型等多种条件筛选数据;统计NaN(缺失值)的数量、占比,根据规则填充和删除NaN;在DataFrame中增、删、查、改行列数据,计算各种行差、列差、极差以及直接对两个DataFrame进行加、减、乘、除运算和比较差异;将宽表和长表相互转换,创建交叉表和各种透视表;对数据分组结果进行求和、累加、求平均值、求极差、求占比、排序、筛选、重采样等多种形式的分析,将分组数据导出为Excel文件。本书还附赠36个数据可视化案例,如根据指定的条件设置行列数据的颜色和样式,根据行列数据绘制条形图、柱形图、饼图、折线图、散点图、六边形图、箱形图、面积图等。本书适于作为数据分析师、物流分析师、金融分析师、数据产品开发人员、人工智能开发人员、市场营销人员、办公管理人员、Python程序员等各行各业人员的案头参考书,无论对于初学者还是专业人士,本书都极具参考和收藏价值。 -
医疗大数据分析与应用平装-胶订医疗大数据是大数据在医疗领域的一个分支,处理的是在与人类健康相关的活动中产生的与生命健康和医疗有关的数据。本书将对医疗大数据进行全面、透彻的分析,从医疗大数据的现状开始,介绍医疗大数据方向的统计、数据挖掘、数据预处理、建模以及可视化等技术与应用。此外,还介绍了医疗领域的图像处理和自然语言处理等人工智能技术。在本书的末尾,还讨论了这个领域普遍关注的一个问题——医疗数据隐私保护,介绍了潜在的隐私风险和隐私保护方法等,并关注了医疗经济的概况与前景。通过阅读本书,你将了解:医疗大数据的现状及产业划分等;如何统计挖掘和处理医疗领域的数据以方便分析;医学数据可视化如何提升医疗人员诊断病情的效率;人工智能技术在医疗领域的应用;如何对医疗数据进行隐私保护。 -
规范性分析平装-胶订本书介绍规范性分析以及如何使用规范性分析进行决策,理论部分和实践部分相对平衡,展示了直观的概念插图、现实的示例问题和案例研究。全书共6章。第1章概述商业分析及分析的纵向视图和简单分类,并介绍规范性分析所处的位置。第2章介绍优化。第3章解释蒙特卡罗模拟、离散模拟和连续模拟等强大的决策工具。第4章介绍多准则决策及其简单分类。第5章介绍专家系统和基于案例的推理。第6章介绍大数据、深度学习和认知计算等前沿分析技术。本书适合商业分析专业人员与相关专业本科生和研究生阅读。
