数据库理论
-
数据科学与大数据技术导论实验陈明本书是《数据科学与大数据技术导论实验》课程的实验教材,可以配合主教材使用。主要内容包括:Linux环境部署、Hadoop开发环境部署、网页数据采集、大数据去重、大数据*值计算、大数据排序、大数据倒排索引、大数据平均值计算、大数据单表关联、大数据可视化。本书选材先进、特点鲜明,注重应用。通过本书所提供的实验练习,可以提高大数据处理能力。可用于大数据实验教材,也可以作为科学技术人员学习和应用大数据的科技参考书。 -
虚拟化与容器徐里萍本书采用理论与实践相结合的形式介绍了虚拟化与容器的相关知识。全书共7章,包括虚拟化与容器概述、计算虚拟化、存储虚拟化、网络虚拟化、Docker容器技术、Kubernetes微服务技术、桌面虚拟化技术应用。本书内容全面,可操作性强,既可作为高等院校计算机相关专业的教材,也可作为政府信息中心管理员、企业网管、网站与网络管理员、计算机安装及维护人员、软件测试人员、程序设计人员等虚拟化相关从业人员的参考用书。 -
基因组片段填充算法研究柳楠无论是目前世界上肆意流行的各类病毒、以癌症为首的各种疾病,还是某些被发 现的新物种,人类对低成本、高效、准确地获取这些生物的全基因组序列都有着迫切 的需求。对于这种大规模数据的分析和处理,仅靠生物学手段无法高效完成,使用计 算机技术将有效节省处理问题的时间和降低经济成本。本书研究的基因组片段填充算 法是在利用生物测序手段获取基因组片段后,使用计算机领域的算法思想和技术,协 助获取完整基因组序列的有效手段,具有较好的实际应用意义。 本书以科研课题“基因组片段填充算法研究”为背景,以设计各类片段填充算法、 分析算法复杂度、提高算法近似性能比为主要目标,对如何使用计算机算法中的贪婪、 局部搜索和匹配等算法思想解决基因组片段填充中的难点问题进行了一系列探 索。本书涵盖了基因组片段填充中各类问题的定义、填充原理和算法描述,通过严谨 的理论推导证明了算法的正确性和近似性能比,并通过实例展示了算法的运行过程和 效果。本书可作为从事基因组序列填充问题研究工作的有关人员的参考用书。 -
数据准备阮敬 任韬数据的获取方式、数据的形式及其结构纷繁芜杂,如何把数据整理成我们想要的样子呢?本书通过真实案例构建了数据准备过程中的方法与技术体系,并通过Python 3编程实现从数据获取到数据整理的全过程。全书内容包括数据来源、数据类型、数据编码、数据清洗、数据插补、数据配平、数据重构、数据变换、数据缩放和数据归约。为使读者能够快速掌握数据准备的方法与技术,本书的数据文件与程序代码均可下载(见封底二维码)。线上操作平台地址为http://ykt.ai-learning.net。本书既可作为高等院校的数据分析类课程教材,也可作为社会科学领域数据分析的自学用书。从事数据分析与数据管理工作的相关人员,以及用Python解决实际数据分析问题的工程技术和管理人员亦可参考使用。 -
腾讯大数据构建之道蒋杰 刘煜宏 陈鹏 郑礼雄 等著全书共13章,分两大部分进行全面而系统的介绍,第一部分从腾讯大数据平台的发展历程和总体架构切入,深入剖析了各项技术原理,阐述了实战过程中的挑战和自研核心技术的设计思想,覆盖了大数据接入、计算、存储、分析、调度等大量技术组件。第二部分主要介绍了腾讯在数据治理、数据应用、机器学习和平台运营方面的建设经验,并对腾讯大数据产品及其在内外部场景的实践落地进行了解读, 书中列举的大量实践案例对广大读者都极具参考价值和借鉴意义。 -
大数据复杂查询技术研究马友忠《大数据复杂查询技术研究》比较全面地介绍云数据管理中多维索引与复杂查询、云环境下针对物联网数据的多维索引技术、可扩展的空间关键字查询、基于Map Reduce的概率集合相似性连接查询、大规模高维向量相似性连接查询、Top-k相似性连接查询、基于随机映射的相似性连接查询、相似性连接查询其他问题、大数据复杂查询面临的挑战等内容。力求向读者系统展示大数据复杂查询领域的最新研究动态,希望能够为从事相关研究的广大读者提供有益的参考和帮助,同时能够为大数据复杂查询相关理论与技术的发展起到一定的促进作用。 -
SPSS统计分析从入门到精通杨维忠 陈胜可本书在前四版畅销书的基础上,根据SPSS 26.0软件升级的市场应用需求进行第5次升级修订。 本书结合具体的SPSS统计分析实例,图文并茂地介绍了**版本SPSS 26.0的各种统计分析方法,包括基本统计分析、参数与非参数检验、方差分析、相关分析、回归分析、多重响应分析、聚类分析、判别分析、因子分析、主成分分析、对应分析、时间序列模型、信度分析、生存分析和缺失值分析的原理和使用方法。全书注重内容的实用性,在详细介绍SPSS常用的操作功能基础上,通过一些综合应用案例(在医学、经济管理、自然科学和社会科学中的应用)来演示实际统计分析中SPSS的使用。 本书适用于SPSS软件17.0~26.0版本,作者录制了96个视频教学文件,读者可通过扫描各章节二维码阅读学习。本书可作为高校经济学、管理学、统计学、公共管理、社会学和卫生统计等专业学生学习大数据分析工具掌握SPSS软件的用书,也可作为从业人员相关研究人员以及作为相关培训机构的参考教材。 -
漫谈云上管理郝峻晟 著云计算在全球已经轰轰烈烈地发展了十几年,近几年在国内更是得到了迅猛的发展。虽然一些IT领域的从业人员对云计算的概念有初步了解,但是传统行业的从业人员对其了解比较有限。由于没有足够的行业经验,传统企业的管理者普遍对云计算理解不深,这会影响企业的数字化转型。《漫谈云上管理:云计算商业模式与数字化转型》基于企业数字化转型的大背景,用通俗易懂的语言介绍云计算的相关知识、商业模式及其对企业数字化转型的影响。《漫谈云上管理:云计算商业模式与数字化转型》共10章,首先介绍云计算的基础知识,然后通过云计算的设计思路、方法论、技术和理念等解决企业各部门存在的问题,帮助企业相关人员了解云,用好云,并最终为企业数字化转型做好准备。《漫谈云上管理:云计算商业模式与数字化转型》内容紧扣企业经营中经常会遇到的实际云计算问题,可帮助企业通过数字化的方式进行价值创新,让管理更加简单,从而降低企业成本。《漫谈云上管理:云计算商业模式与数字化转型》适合广大云计算爱好者阅读,尤其适合对云计算架构和商业模式感兴趣的人员以及参与企业数字化转型的相关人员阅读。 -
DM8数据中心解决方案徐飞 等达梦实时同步工具是数据库行业内数据实时同步的一个标杆。本书以达梦实时同步工具4.0为蓝本,介绍达梦数据库本地和异地容灾的解决方案,主要包括达梦实时同步工具的技术原理、特点、系统架构、配置和使用方法,以及日常运维和典型案例分析等。本书语言流畅、通俗易懂,并介绍了具体应用案例,是深入了解达梦数据中心解决方案的基础指南,具有较高的参考价值。本书可以作为计算机、数据库等专业的教材,也可以作为工程技术人员的参考用书。 -
基于鲲鹏的大数据挖掘算法实战袁春 刘婧 王工艺 著暂缺简介...
