数据库
-
大数据复杂查询技术研究马友忠《大数据复杂查询技术研究》比较全面地介绍云数据管理中多维索引与复杂查询、云环境下针对物联网数据的多维索引技术、可扩展的空间关键字查询、基于Map Reduce的概率集合相似性连接查询、大规模高维向量相似性连接查询、Top-k相似性连接查询、基于随机映射的相似性连接查询、相似性连接查询其他问题、大数据复杂查询面临的挑战等内容。力求向读者系统展示大数据复杂查询领域的最新研究动态,希望能够为从事相关研究的广大读者提供有益的参考和帮助,同时能够为大数据复杂查询相关理论与技术的发展起到一定的促进作用。 -
MySQL 8.x从入门到精通李小威MySQL是比较受欢迎的开源关系型数据库之一。本书通过大量实用的操作案例,详细讲解MySQL 8.x数据库操作方法和技巧。本书配套资源提供了所有例子的源代码、PPT课件、培训班形式的同步教学视频、命令速查手册、QQ群与微信群答疑,以方便读者参考和自学。本书共分25章。主要内容包括MySQL 8.x的安装与配置、数据库和数据表基本操作、数据类型和运算符、MySQL函数、数据的增删改查、索引的设计和使用、存储过程和函数、视图、触发器、存储引擎的选择、分区和事务控制、性能优化、锁定机制、服务器性能优化、性能监控、数据备份与还原、日志、权限与安全管理、高可用架构、复制、MySQL Utilities、MySQL Proxy。最后通过两个案例系统的数据库设计,进一步讲解MySQL在系统开发中的应用。本书注重实战操作,帮助读者循序渐进地掌握MySQL的各项管理与开发技术。本书适合MySQL数据库初学者、MySQL数据库开发人员和MySQL数据库管理员,同时也能作为高等院校相关专业师生的教学用书。 -
吃透SQL张明星随着大数据时代的到来,SQL语言作为访问和处理数据库的标准计算机语言,已成为数据分析的必备技能。本书循序渐进地讲解了使用SQL语言操作数据库的核心知识,并通过具体示例的实现过程演练了查询、更新、删除、添加、维护数据的方法和流程。全书简洁而不失其技术深度,内容丰富全面,以精炼的文字介绍了复杂的案例,帮助读者从知识点讲解平滑过渡到动手实践。 -
HBase应用实战与性能调优张文亮 著HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统。利用HBase技术可以在廉价的PC服务器上搭建大规模的存储化集群,可以对数十亿级别的大数据进行实时性的高性能读写,在满足高性能的同时还保证了数据存取的原子性。 本书由浅入深地讲解HBase的概念、安装、配置、部署、高级用法、性能调优,内容既兼顾了初学者,也适用于想要深入学习HBase的读者。 本书适用于以前没有接触过HBase,或者对HBase有所了解并希望深入学习的读者,同时适用于HBase应用开发人员和系统管理人员。不管你是HBase新手还是HBase专家,相信都能从本书中有所收获。 -
数据可视化李伊本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。 -
SPSS统计分析从入门到精通杨维忠 陈胜可本书在前四版畅销书的基础上,根据SPSS 26.0软件升级的市场应用需求进行第5次升级修订。 本书结合具体的SPSS统计分析实例,图文并茂地介绍了**版本SPSS 26.0的各种统计分析方法,包括基本统计分析、参数与非参数检验、方差分析、相关分析、回归分析、多重响应分析、聚类分析、判别分析、因子分析、主成分分析、对应分析、时间序列模型、信度分析、生存分析和缺失值分析的原理和使用方法。全书注重内容的实用性,在详细介绍SPSS常用的操作功能基础上,通过一些综合应用案例(在医学、经济管理、自然科学和社会科学中的应用)来演示实际统计分析中SPSS的使用。 本书适用于SPSS软件17.0~26.0版本,作者录制了96个视频教学文件,读者可通过扫描各章节二维码阅读学习。本书可作为高校经济学、管理学、统计学、公共管理、社会学和卫生统计等专业学生学习大数据分析工具掌握SPSS软件的用书,也可作为从业人员相关研究人员以及作为相关培训机构的参考教材。 -
MySQL数据库进阶实战赵渝强 著本书是作者基于多年的教学与实践进行的总结,重点介绍了MySQL数据库的核心原理与体系架构,涉及开发、运维、管理与架构等知识。全书共12章,包括MySQL数据库基础、详解 InnoDB存储引擎、MySQL用户管理与访问控制、管理MySQL的数据库对象、MySQL应用程序开发、MySQL的事务与锁、MySQL备份与恢复、MySQL的主从复制与主主复制、MySQL的高可用架构、MySQL性能优化与运维管理、MySQL数据库的监控和使用MySQL数据库的中间件。读者根据本书中的实战步骤进行操作,可以在实际项目的生产环境中快速应用并实施MySQL。 本书基于MySQL 8.0版本编写,为读者提供了完整的实例代码(获取方式见封底)。本书适合对MySQL数据库技术感兴趣的平台架构师、运维管理人员和项目开发人员阅读。读者无论是否接触过数据库技术,只要具备基础的Linux和SQL知识,都能够通过本书快速掌握MySQL并提升实战经验。 -
大数据环境下的科技信息潜在语义挖掘技术优化与比较研究崔运鹏 著大数据时代,数据作为一种新的经济资产,驱动科学研究处于以数据为基础进行科学发现的第四范式。不同的学科领域,正在不同的层面上广泛地关注着大数据给本领域的研究和实践带来的深刻影响,大数据技术在情报研究领域的应用逐渐深入。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。对于在数据分析领域扮演重要角色的情报研究工作而言,大数据的理念和技术既带来了机遇,也带来了挑战。一方面,在大数据时代,情报研究工作得到空前的重视,大数据为情报研究的新发展提供了机会,它从更为广阔的视野来看待情报研究的定位,研究新技术新方法,解决新问题,极大地促进情报研究理论与实践的发展;另一方面,大数据时代要求各行各业重视情报研究工作,这就必然使得众多学科有意识地涉足以往作为专门领域的情报研究,并将其作为本学科的重要组成部分加以建设。现代情报研究已经迈入了大数据时代。 大数据技术和相关理念能够为情报研究、决策制定等工作的开展提供更多支持,本书以潜在语义挖掘理论研究与分布式并行计算方法研究、分布式潜在语义挖掘并行计算技术研发及大数据环境下潜在语义挖掘比较研究3项内容为切入点,重点解决文献服务实际应用场景下的大规模科技文档语料潜在语义信息挖掘的问题,化解大规模科技信息文档语料潜在语义挖掘分布式并行计算过程及定量判断大数据环境下科技文献数量变化对深度潜在语义挖掘影响的核心技术难点。对文本挖掘交叉领域关系、文献领域语义挖掘的多样化挑战、研究应用前景等进行了探讨,希望为科技信息潜在语义挖掘技术研究工作的开展提供参考,为理论研究及实践应用等方面水平的提升提供更多支持。 -
大数据技术及架构图解实战派徐葳本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包含以下内容。.一、数据采集日志数据采集工具(Flume 、Logstash、Filebeat )数据库数据采集工具(离线采集工具——Sqoop、DataX,实时数据采集工具——Canal、Maxwell 网页数据采集工具物联网数据采集工具消息队列中间件.二、数据存储分布式文件存储之HDFSNoSQL数据库之HBaseNoSQL数据库之Redis.三、离线数据计算离线计算引擎MapReduce离线计算引擎Spark.四、实时数据计算实时计算引擎Storm实时计算引擎Spark Streaming新一代实时计算引擎Flink.五、OLAP数据分析 离线OLAP引擎(Hive、Impala、Kylin)实时OLAP引擎(Druid、ClickHouse、Doris).六、全文检索引擎 Lucene SolrElasticsearch.七、分布式任务调度系统AzkabanOoizeDolphinScheduler.八、分布式资源管理 YARN的原理、架构YARN中的资源调度器【实战】配置和使用YARN多资源队列.九 、大数据平台搭建工具 大数据平台工具HDP大数据平台工具CDH大数据平台工具CDP.本书还介绍了多个企业级大数据应用案例(包括海量数据采集、“双十一”数据大屏、海量数据全文搜索系统等)和大数据平台架构案例(包括离线数据仓库架构、实时数据仓库架构、批流一体化数据仓库架构、数据中台架构、直播大数据平台架构、电商大数据平台架构等),可以帮助读者从全局角度理解大数据。.在本书中,技术内容基本上都是从零讲起的,结合原理和架构,以“图解 实战”的形式帮助读者轻松理解复杂的知识。 -
数据准备阮敬 任韬数据的获取方式、数据的形式及其结构纷繁芜杂,如何把数据整理成我们想要的样子呢?本书通过真实案例构建了数据准备过程中的方法与技术体系,并通过Python 3编程实现从数据获取到数据整理的全过程。全书内容包括数据来源、数据类型、数据编码、数据清洗、数据插补、数据配平、数据重构、数据变换、数据缩放和数据归约。为使读者能够快速掌握数据准备的方法与技术,本书的数据文件与程序代码均可下载(见封底二维码)。线上操作平台地址为http://ykt.ai-learning.net。本书既可作为高等院校的数据分析类课程教材,也可作为社会科学领域数据分析的自学用书。从事数据分析与数据管理工作的相关人员,以及用Python解决实际数据分析问题的工程技术和管理人员亦可参考使用。
