数据库
-
k-均值问题的近似算法张冬梅、李敏、徐大川k-均值问题是经典组合优化问题, 也是著名的NP-难问题之一, 相应的Lloyd算法是数据挖掘的 十大经典算法之一. k-均值问题在人工智能、数据挖掘、理论计算机科学、运筹学和管理科学中有 着广泛的应用. 本书介绍k-均值问题及其变形的基于随机抽样、降维、核心集、近似质心集、局部 搜索、线性规划舍入等技术的近似算法. 主要内容包括: 经典k-均值问题的近似算法, k-中位, 球面 k-均值, 鲁棒k-均值, 带约束的k-均值, 隐私保护k-均值, k-均值的其他变形等. -
高等院校、科研机构及企业数据分析方法杨晓鹏本书重点介绍Amos、Mplus 和SmartPLS 统计软件里的结构方程分析方法。包括结构方程模型路径图的构建与数据的收集,结构方程模型的识别、分析结果评价及修正,反映型指标、形成型指标与二阶段分析,调节效应分析、中介效应分析、多群体差异分析与潜在平均分析,以及结构方程模型高级的分析方法即贝叶斯检验、混合回归分析、潜在成长模型、MTMM 模型等内容。没有复杂的理论推导,而是结合作者自身的教学与科研实践,以数据为依托,深入浅出,使读者能在短时间内理解并掌握结构方程模型分析方法,进而应用到自己的研究实践中。 -
物联网大数据分析实战[美]安德烈·敏特尔 著,吴骅 译《物联网大数据分析实战 》详细阐述了与物联网大数据分析相关的基本解决方案,主要包括物联网分析和挑战、物联网设备和网络协议、云和物联网分析、创建AWS云分析环境、收集所有数据的策略和技术、探索物联网数据、增强数据价值、可视化和仪表板、对物联网数据应用地理空间分析、物联网分析和数据科学、组织数据的策略、物联网分析的经济意义等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。 -
数据科学与机器学习[澳]迪尔克·P. 克洛泽,[澳]兹德拉夫科·I. 波提夫,[澳]托马斯·泰姆勒,[澳]拉迪斯拉夫·维斯曼 著本书旨在为有兴趣更好地理解数学和统计的学生提供一个可访问的、全面的教科书,这些数学和统计知识是数据科学和机器学习算法的基础。 -
大数据分析研究进展周志华,张敏灵,巫英才,瞿裕忠,姜育刚大数据是推动创新型国家建设的重要战略资源。《大数据分析研究进展》从机器学习、可视分析、知识处理、数据挖掘等角度出发,详细讨论了大数据分析的相关基础理论和技术方法,主要包括:大数据机器学习理论与方法,大数据可视分析理论与方法,多源不确定数据挖掘方法与技术,自动深层化知识处理方法与技术,大数据分析平台、标准与应用示范等。《大数据分析研究进展》总结了部分代表性工作,并呈现给读者。 -
Redis + MongoDB + HBase赵渝强本书介绍了NoSQL数据库生态圈体系,包括Redis、MongoDB和HBase,内容涉及开发、运维、管理与架构。“第1篇 基于内存的NoSQL数据库”(第1~5章)包括:内存对象缓存技术Memcached、Redis基础、Redis高级特性及原理、Redis集群与高可用和Redis故障诊断与优化。“第2篇 基于文档的NoSQL数据库”(第6~10章)包括:MongoDB基础、操作MongoDB的数据、MongoDB的数据建模、MongoDB的管理和MongoDB的集群。“第3篇 列式存储NoSQL数据库”(第11~15章)包括:HBase基础、部署与操作HBase、HBase原理剖析、HBase的高级特性和监控与优化HBase集群。 -
MongoDB性能调优实战[澳]盖伊·哈里森,[澳]迈克尔·哈里森本书分为以下几个主要部分:第 1-3 章介绍方法和技术。在这些章节中,我们描述了一种性能调优方法。还提供了一些关于 MongoDB 架构和 MongoDB 提供的用于调查、监控和诊断 MongoDB 性能的工具的背景知识。第 4 章和第 5 章介绍应用程序和数据库设计。第 6-10 章介绍应用程序代码的优化。第 11-14 章讨论MongoDB 服务器及其运行硬件的优化。 -
大数据导论于俊伟,母亚双,闫秋玲本书围绕新工科背景下大数据人才培养需求编写,系统介绍了大数据采集与预处理、大数据存储与管理、大数据处理与分析、大数据可视化处理流程;重点分析了科大讯飞大数据平台在政务、交通、金融和用户画像等实际场景中的应用,还介绍了大数据实验环境的详细搭建步骤;最后介绍了大数据治理中法律政策、行业标准建设的最新进展,分析了大数据可能带来的伦理风险和应对策略。本书将大数据基础理论与实际案例结合,辅以编程实践和有针对性的课后习题,可作为高等院校相关专业的导论课教材,也可作为大数据相关从业人员技术参考书。 -
Kafka权威指南[美] 格温·沙皮拉,[美] 托德·帕利诺本书介绍Kafka的技术原理和应用技巧。内容包括如何安装和配置Kafka、如何使用Kafka API、Kafka的设计原则和可靠性保证,以及Kafka的一些架构细节,如复制协议、控制器和存储层。本书列举了一些非常流行的Kafka应用场景,比如基于事件驱动的微服务系统的消息总线、流式处理应用程序和大规模数据管道。通过学习本书,你不仅能够深入理解这项大数据核心技术,还能够将所学知识付诸实践,在生产环境中更好地运行Kafka,并基于它构建稳健的高性能应用程序。 -
ClickHouse性能之巅陈峰 著这是一本通过分析ClickHouse底层引擎架构来解读ClickHouse极致性能的底层逻辑的著作,同时还总结了ClickHouse在各种适用场景中的使用技巧和性能调优方法,让读者知其然,也能知其所以然。全书一共12章,分为两个部分:第1部分 架构篇(第1-7章)简要地介绍了数据仓库的核心技术和思路,系统讲解了ClickHouse的查询性能优势、适用场景、架构设计和运作过程,深入地剖析了ClickHouse的存储引擎架构、计算引擎架构以及决定ClickHouse性能的关键因素,还将ClickHouse与其他数仓架构进行了深度对比,不仅阐明了ClickHouse查询速度快的底层逻辑,也推导出了ClickHouse的适用场景。第2部分 实战篇(第8-12章)针对ClickHouse的适用场景,讲解了它的各种使用技巧以及存算分离架构、分布式架构等云计算时代的全新架构,更重要的是,从数据结构、内存、磁盘、网络、CPU、查询等方面全面总结了ClickHouse的性能优化方法和原则。
