数据库
-
云原生数据仓库李飞飞,周烜,杨程程,林亮,王远本书深入地探讨云原生数据仓库的理论知识与技术实践,涵盖数据仓库的发展历程、大数据处理技术、云原生数据仓库的概念与特点,以及云计算时代的数据仓库技术。书中详细介绍云原生数据仓库的架构设计,计算引擎、优化器、存储的关键技术,以及资源管理与调度等知识。同时,本书结合Redshift、Snowflake、BigQuery等典型的云原生数据仓库,以及AnalyticDB等具有代表性的国产数据仓库,介绍大量的实践案例。此外,书中针对云原生数据仓库的资源调度、查询优化、运维管理等方面进行深入的剖析,提供大量的最佳实践和应用场景。 -
Python数据分析与挖掘实战张春福 白婧 张良均 范林元 吴建平本书共13章,分三个部分:基础篇、实战篇、提高篇。 (1)基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 (2)实战篇(第6~12章),重点对数据挖掘技术在金融、航空、零售、农业、制造和互联网等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程关键环节,穿插程序实现代码。最后通过上机实践,加深数据挖掘技术在案例应用中的理解。 (3)提高篇(第13章),围绕去编程化的TipDM大数据挖掘建模平台,先介绍了平台每个模块的功能,再以航空公司客户价值分析案例为例,介绍如何使用平台快速搭建数据分析与挖掘的工程,展示平台去编程化、流程化的特点。 -
Power Query数据智能整理从入门到进阶侯翔宇"《Power Query数据智能整理从入门到进阶》结合多个典型实操案例,全面、系统地介绍Power Query for Microsoft Excel数据智能整理的相关知识,可以帮助读者掌握其强大的数据操控力,从而轻松完成商务、办公和科研等领域的数据智能整理任务。《Power Query数据智能整理从入门到进阶》从基础入门、数据传输和数据整理3个方面进行讲解,既能带领零基础入门人员快速跨入Power Query数据智能整理的大门,又能帮助职场中的相关从业人员进阶提升,从而提高工作效率。《Power Query数据智能整理从入门到进阶》共11章,分为3篇。第1篇基础入门,主要介绍Power Query的功能、特点、运行环境、版本、工作流程和软件操作界面等相关知识;第2篇数据传输,主要介绍数据导入、数据导出和查询管理等相关知识;第3篇数据整理,主要介绍表级运算、调整行与列的结构、添加列、调整数据表的结构、修改数据表的内容等相关知识。《Power Query数据智能整理从入门到进阶》内容丰富,通俗易懂,实例典型,实用性强,非常适合零基础Power Query入门读者阅读,也适合需要提高数据整理水平的从业人员阅读,还适合大中专院校和相关培训机构作为教材。" -
Redis应用实例黄健宏本书将从内部组件、外部应用和数据结构3个方面为读者介绍Redis常见、经典的用法与实例,并且所有实例均附有完整的Python代码,方便读者学习和参考。全书分3个部分:第一部分讲内部组件,介绍的实例通常用于系统内部,如缓存、锁、计数器、迭代器、速率限制器等,这些都是很多系统中不可或缺的部分;第二部分讲外部应用,介绍的实例都是一些日常常见的、用户可以直接接触到的应用,如直播弹幕、社交关系、排行榜、分页、地理位置等;第三部分讲数据结构,介绍的实例是一些使用Redis实现的常见数据结构,如先进先出队列、栈、优先队列和矩阵等。本书希望通过展示常见的Redis应用实例来帮助读者了解使用Redis解决各类问题的方法,并加深读者对Redis各项命令及数据结构的认识,使读者真正成为能够使用Redis解决各类问题的Redis专家。本书适合对Redis有基本了解且想要进一步掌握Redis及键值数据库具体应用的技术人群,是理想的Redis技术进阶读物。 -
SQL入门与实践宋娟SQL作为操作数据库的标准语言,可以用于执行查询、管理数据、控制数据库结构等多种任务,在数据库开发、数据分析和数据管理中扮演着重要的角色。在大数据、人工智能和机器学习的数据预处理阶段,SQL 用于数据清洗、转换和准备,是不可或缺的工具。SQL入门与实践(微课视频版)结合中小实例,详细论述了 SQL 在 MySQL、SQL Server 和 Oracle 三种关系数据库管理系统(RDBMS)中的具体应用,对比学习,有利于读者深刻理解知识点,全面掌握 SQL 的知识体系、使用方法和技巧。SQL入门与实践(微课视频版)共 20 章,详细介绍了 SQL 数据库及 SQL 语句的使用方法,具体内容包括数据库及基本操作、SQL 基础、数据表、索引、查询数据、条件查询、高级条件查询、SQL 函数的使用、聚合函数与分组数据、多表连接查询、子查询、视图、插入数据、更新和删除数据、管理数据库的安全、完整性控制、存储过程和函数、SQL 触发器、控制流语句和事务处理等。在具体介绍过程中,经验技巧和注意事项等随机融入其中,可以让读者的学习过程少走弯路。SQL入门与实践(微课视频版)内容丰富,知识体系完整,实例多,实用性强,适合作为高校计算机科学与技术、软件工程、信息管理等相关专业的教材,也适合各类数据库管理人员、数据库开发人员和程序员参考学习。 -
Spark SQL大数据分析快速上手迟殿委,王泽慧,黄茵茵本书内容基于Spark新版本展开,符合企业目前开发需要。本书全面讲解Spark SQL相关知识和实战应用,各章均提供较为丰富的案例及其详细的操作步骤,并配套示例源码、数据集、PPT课件和教学大纲。本书共10章。第1~3章为Spark SQL的基础准备部分,内容包括Spark SQL的发展和简介、Spark的典型数据容器及关系、Spark概述与环境搭建、Spark典型数据结构RDD;第4~7章为Spark SQL的基础应用部分,内容包括Spark SQL入门实战(包括Scala编程基础)、SQL基础语法、操作多数据源、SparkSQL性能调优等;第8~10章分别通过影评数据分析、商品统计数据分析、咖啡销售数据分析等3个实战项目进行巩固提升。本书内容翔实、示例丰富,既可作为Spark初学者、大数据分析人员、大数据应用开发人员的自学手册,也可作为高等院校或高职高专院校计算机、软件工程、数据科学与大数据技术、智能科学与技术、人工智能等专业大数据课程的教材。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。版权所有,侵权必究。举报:010-62782989,beiqinquan@tup.tsinghua.edu.cn。 -
大数据开发实战猿媛之家本书深入探讨了大数据技术的核心概念和实际应用。从大数据的基础架构Hadoop开始,逐步解析了分布式协调服务Zookeeper、数据仓库Hive、面向列的数据库HBase等关键技术。此外,还介绍了数据迁移工具Sqoop、数据采集工具Flume、发布订阅消息系统Kafka等实用工具。本书还深入讲解了数据处理分析引擎Spark、全文搜索引擎Elasticsearch及分布式处理引擎Flink的工作原理和应用实例。最后,通过电商推荐系统实战和Flink实现电商用户行为分析两个案例,展示了大数据技术在实际业务中的应用。本书附带全书实例源代码、电子版本教程(下载方式见封底),以及可扫码观看的长达13个小时的部分实例操作视频,帮助读者更深入了解大数据技术的具体内容,非常适合对大数据技术感兴趣的读者,尤其是想要深入了解大数据技术原理和应用的开发者和管理者阅读。 -
基于R语言分析的心理语言学眼动数据处理王敬欣,李琳R语言在心理语言学研究中的应用已经有相当长的历史,但什么情况下要对数据进行怎样的处理,模型应该如何构建,得到结果后应该如何科学地读取和规范地报告等问题仍未得到很好的解决,本书意在解决这些问题。本书首先介绍了R语言基础知识、基本统计思路和初步数据整理,对经由真实眼动研究得到的数据进行清理、转换和描述性统计,以及数据可视化等操作,然后介绍了线性混合模型和最大随机效应,结果解释、整理和提升,power分析和Bayes分析在R语言中的实现;接着介绍了线性混合模型和重复测量方差分析结果的比较;最后介绍了多种眼动指标整理的方法。 -
Oracle PL/SQL实例精解[美]本杰明·罗森维格,[加]艾琳娜·拉希莫夫本书根据PL/SQL的新版本进行了全面更新,涵盖从基础语法、程序控制到最新的优化和调优增强等方面的知识,通过真实的实验、大量的示例讲解了PL/SQL技能,是一本逐步分解的、详尽的PL/SQL编程教程。读者可以按照本书的步骤一步一步地完成每一个关键任务,掌握Oracle 21c PL/SQL编程技术,深度探索PL/SQL编程技术及最佳实践。本书既适合新手数据库开发人员和DBA阅读,也适合有一定经验的从业人员阅读。 -
循序渐进Spark大数据应用开发柳伟卫《循序渐进Spark大数据应用开发》结合作者一线开发实践,循序渐进地介绍了新版Apache Spark 3.x的开发技术。全书共10章,第1章和第2章主要介绍Spark的基本概念、安装,并演示如何编写最简单的Spark程序。第3章深入探讨了Spark的核心组件RDD。第4章讲解了Spark集群管理,帮助读者理解任务提交与执行的基本原理。第5章介绍了Spark SQL,这是处理结构化数据的基础工具。第6章展示了Spark Web UI,通过界面化的方式了解Spark集群运行状况。第7章和第8章分别介绍了Spark流式数据处理框架Spark Streaming和Structured Streaming。第9章和第10章则分别介绍了业界流行的机器学习和图计算处理框架MLlib和GraphX。书中各章节还提供了丰富的实战案例和上机练习题,以便读者在学习的同时进行实际操作,迅速提升动手能力。《循序渐进Spark大数据应用开发》技术先进,案例丰富,适合对Spark大数据应用感兴趣的学生、大数据开发人员及架构师使用,也可作为培训机构和高校大数据课程的教学用书。
