数据库
-
k-均值问题的近似算法张冬梅、李敏、徐大川k-均值问题是经典组合优化问题, 也是著名的NP-难问题之一, 相应的Lloyd算法是数据挖掘的 十大经典算法之一. k-均值问题在人工智能、数据挖掘、理论计算机科学、运筹学和管理科学中有 着广泛的应用. 本书介绍k-均值问题及其变形的基于随机抽样、降维、核心集、近似质心集、局部 搜索、线性规划舍入等技术的近似算法. 主要内容包括: 经典k-均值问题的近似算法, k-中位, 球面 k-均值, 鲁棒k-均值, 带约束的k-均值, 隐私保护k-均值, k-均值的其他变形等. -
Spark大数据实时计算杨力本书从大数据实时计算框架Spark的编程语言Scala入手,第1~4章重点介绍函数式编程语言Scala的基础语法、面向对象编程以及函数式编程等,再通过编程训练案例介绍Scala这门语言的实际开发应用,为读者后面学习Spark框架打下牢固的编程基础。第5~10章重点介绍Spark的安装部署、SparkCore编程、Spark SQL结构化数据处理以及Spark Streaming实时数据处理等,对它们进行详细的剖析和解读。最后,在第11章中通过网站运营指标统计和IP经纬度热力图分析两个实战开发项目,让读者充分掌握Spark大数据实时计算框架技术的应用与实操方法。本书适合所有对大数据技术感兴趣的读者。 -
数据流挖掘与在线学习算法李志杰本书是一本关于数据流挖掘与在线学习算法的著作,该书全面、系统阐述了数据流机器学习的模型、算法、平台与实例。全书共10 章,分为4 个部分:第1 部分包括第1~3 章,介绍数据流机器学习基础知识;第2 部分(第4~6章)介绍基于频繁模式的数据挖掘与在线学习算法;第3 部分是基于模型的在线学习算法,包括第7 章在线稀疏学习模型和第8 章在线低秩表示模型;第4 部分(第9、10 章)介绍基于实例的数据流概念演变检测和在线学习算法。对每种典型在线学习算法的背景、模型定义、算法设计思想以及相关实验分析等,书中都有都完整的阐述。同时,也详细分析了一些与在线学习密切相关的离线数据挖掘和机器学习算法与应用。本书的实验平台开源、简单易用。每章后面都设计了操作性强的课程实验。在图书“下载专区”目录下,免费提供了本书代码和相关教学配套资源的在线浏览与下载。本书适合作为高等学校数据科学与大数据应用、智能科学与技术、人工智能等专业本科生和研究生的教材与教学参考书,也可供研究数据流挖掘与在线学习算法的科技人员阅读和使用。 -
Origin科技绘图与数据分析实战李润明Origin是国际科技出版界公认的标准作图软件,它功能强大、操作简单,被科研人员、工程技术人员、高校师生等广泛使用。Origin软件不仅具有强大的数据可视化功能,还具有统计分析、信号处理、函数拟合、峰值分析等功能,且支持多种格式的数据导入和导出。本书基于Origin 2021和Origin 2022版本进行案例讲解,旨在帮助读者快速入门,并掌握Origin软件的使用技巧。本书由浅入深地讲解了Origin软件的功能和相关案例,涉及基础2D图、等高线图、3D图以及专业图的绘制,也涵盖了数学运算、拟合分析、信号处理、多峰分析等主题。本书适用于Origin软件的初学者和希望提高科技绘图及数据分析处理能力的读者,尤其适用于大中专院校的师生以及广大科研工作者。 -
MySQL高可用解决方案徐轶韬本书对MySQL官方提供的高可用解决方案逐一进行介绍,详细阐述每种方案的原理、架构、优缺点及适用场景,并配合演示说明,帮助读者快速理解相关内容。与其他MySQL高可用相关图书不同,本书专注于MySQL官方团队提供的解决方案,包括MySQL主从复制、MySQL ReplicaSet、组复制、InnoDB Cluster及InnoDB ClusterSet等相关内容。此外,本书还介绍了MySQL 8.0的部分内容,包括文档存储、MySQL Shell及MySQL Router等。附录部分介绍了企业版监控、企业版备份等MySQL官方工具,以及克隆插件和虚拟机环境VirtualBox,使读者可以更加全面地了解MySQL的生态和工具。通过本书,MySQL数据库开发人员、MySQL数据库管理人员和架构师可以了解MySQL当前全部的产品特性和高可用解决方案,获知每种方案的详细内容,并能够将高可用解决方案灵活运用到实际的生产解决方案中。本书面向的读者对象包括MySQL的初学者、数据库架构师、DBA、相关软件开发人员,以及组织内部的IT负责人。 -
高性能MySQL(美)Silvia Botros(西尔维亚·博特罗斯), Jeremy Tinley(杰里米·廷利)《高性能MySQL(第3版)》是MySQL 领域的极佳之作,拥有广泛的影响力。第4版更新了大量的内容,全书共分为16章和6 个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。《高性能MySQL(第4版)》不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。 -
基于GaussDB的实现方法李雁翎本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。 全书共分3部分: 第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能; 第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训练,使读者进一步加深对主教材内容的理解和掌握; 第三部分为习题解答,是对习题集的部分内容提供相应的答案。 -
HBase入门与实践彭旭本书以当前稳定版 HBase 2.4.9 为基础,将 Hadoop 升级到 2.10.1 版本,并对客户端 API 进行升级。本书以精练的语言介绍 HBase 的基础知识,让初学者能够快速上手使用 HBase;深入分析 HBase 的核心思想(如数据读取和数据备份等)和 HBase 架构(如 B+树、LSM 树和 WAL 等),专注于 HBase 在线实时系统的调优,使 HBase 集群响应延迟更低,让有经验的 HBase 开发人员能循序渐进地理解 HBase 源代码,更好地调试和解决各种实际问题;本书从企业常见的“用户行为日志管理系统”着手,结合 HBase 的实际应用场景,让读者快速上手,真正做到从入门到实践。本书非常适合作为有一定 Java 基础的开发人员的 HBase 入门教程,也适合作为HBase 运维人员部署和监控 HBase 的参考手册,还适合作为将 HBase 应用到在线生产环境中的开发人员进行 HBase 在线集群性能调优的技术指南。 -
数据浪潮吴垚近年来,基础软件的发展越来越受到重视,越来越多的计算机从业者对数据管理系统和大数据的知识产生了强烈的需求。本书既介绍了数据管理系统的技术发展史,又介绍了数据管理系统的关键技术内涵,同时还介绍了一系列主流的商业化产品及其架构,并对前沿技术进行了讨论分析,给出作者自己的见解和洞察。本书内容主要包括数据库与大数据的诞生、发展和商业应用,数据库与大数据之间的关系,国产数据库的国际化,数据管理系统的共同之处,数据管理系统的算法理论、前沿技术等。本书适合数据管理系统或大数据方向的技术人员和科研人员阅读,也适合互联网科技公司的技术人员及管理人员,以及对特定领域的商业和历史感兴趣的读者阅读。 -
Proxmox VE超融合集群实践真传田逸本书详细介绍Proxmox VE。Proxmox VE是一个完整的企业虚拟化开源平台,具有去中心化的超融合特性。Proxmox VE与前端负载均衡整合,可实现关键应用的高可用性。 全书共15章,大致可分为几个部分:第1章和第2章为概述部分,主要介绍Proxmox VE的基本特性及功能;第3~6章为基础部分,总览Proxmox VE部署、简单管理等操作;第7~10章为项目实战,也是本书的精华部分,介绍不同场景下如何规划、实施Proxmox VE;第11章和第12章为Proxmox VE 投入生产以后所需进行的日常工作,包括日常管理及平台升级;第13~15章为扩展部分,主要介绍以在线方式迁移其他系统到Proxmox VE平台、以Proxmox VE做底层实现桌面云,以及使用过程中一些问题的汇总。 本书适合有一定Linux基础并且正在从事系统运维的技术人员、计算机专业学生、高可用系统架构研究者阅读。
