书籍详情

高效使用Greenplum:入门、进阶与数据中台

高效使用Greenplum:入门、进阶与数据中台

作者:王春波 著

出版社:机械工业出版社

出版时间:2021-12-01

ISBN:9787111696490

定价:¥109.00

购买这本书可以去
内容简介
  这不仅是一本从原理到使用、从入门到进阶讲解Greenplum的著作,而且是一本指导企业用更省钱、更高效地方式使用Greenplum构建企业级数据仓库和数据中台的著作。作者在数据架构和数据仓库一线工作10余年,积累了丰富的项目经验,他用浅显易懂的语言、贴近生产环境的案例、丰富的示意图例写作了本书,能帮助读者快速掌握具有实战价值的知识。具体地,阅读本书你将收获如下内容: ·掌握数据仓库技术的发展历程和发展方向; ·理解MPP架构的架构特点和实现逻辑; ·Greenplum数据库的安装和基本操作; ·Greenplum数据库的工作原理; ·SQL语句从入门到开发实战; ·Greenplum数据库ETL相关功能的具体用途; ·机器学习、文本处理、图计算、GIS等的入门知识; ·掌握Greenplum数据库的运维和监控要点; ·全面掌握Greenplum数据库的性能优化; ·数据中台的理念和建设路径; ·数据中台从接口到智能化应用的项目实战; ·零售行业数据中台的项目实战案例。
作者简介
  王春波资深架构师和数据仓库专家,现任上海启高信息科技有限公司大数据架构师,Apache Doris和openGauss贡献者,Greenplum中文社区参与者。 具有十多年的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深入研究,尤其擅长用优雅的SQL实现复杂的逻辑。 常年奔波在各个项目交付现场,曾成功主导过中国邮政储蓄银行、南海农商银行、广东省联社、前海微众银行、广东南粤银行等多家银行的管理会计项目,以及卡宾、安踏、特步等多家零售鞋服企业的数据中台项目。 公众号“数据中台研习社”运营者。
目录
序一
序二
序三
前言
第一部分 大数据平台概述
第1章 大数据平台技术的演进2
11 关系型数据库2
111 数据库发展历程2
112 关系型数据库独霸天下4
113 结构化查询语言SQL4
114 列存储的兴起5
12 Hadoop生态系统7
121 Hadoop概述7
122 Hadoop生态圈7
123 Hadoop的优缺点9
13 NoSQL的瓶颈和SQL数据库的回归10
131 NoSQL产品的发展10
132 NoSQL的共性11
133 SQL数据库的回归12
14 MPP架构的兴起14
141 什么是MPP架构14
142 MPP架构的蓬勃发展15
143 MPP数据库代表—TBase17
144 浅谈HTAP19
第二部分 Greenplum入门
第2章 Greenplum概述24
21 Greenplum的前世今生24
22 Greenplum数据库架构27
23 Greenplum数据库的特点28
24 Greenplum新特性及展望30
25 Greenplum的优势32
第3章 Greenplum的安装与部署35
31 Greenplum数据库安装过程35
311 准备工作35
312 安装Master节点39
313 复制安装包到其他节点41
314 初始化Greenplum数据库42
32 安装GPCC43
33 Greenplum访问接口46
331 CLI46
332 JDBC47
333 ODBC48
34 Greenplum数据库常用命令48
341 启动和停止48
342 修改参数49
343 其他常用命令51
35 Greenplum性能测试52
第4章 Greenplum使用入门54
41 数据类型详解54
411 基本数据类型54
412 特殊数据类型56
413 组合数据类型60
42 数据表的基本使用62
421 表对象定义62
422 表的基本操作63
423 数据的基本操作64
43 数据表的高级应用65
431 数据表的存储特性69
432 分区表详解72
433 外部表76
44 数据库函数79
441 数学函数79
442 三角函数列表80
443 字符串函数和操作符80
444 类型转换相关函数82
445 自定义函数83
45 数据库的其他对象85
451 视图85
452 索引85
453 序列87
第三部分 Greenplum应用
第5章 Greenplum查询详解90
51 SQL语法92
511 简单SQL语法92
512 WITH子句特性95
513 IN语句和EXISTS语句98
514 MERGE子句的实现100
52 JOIN操作101
53 分析函数的妙用106
54 高级函数精选110
第6章 ETL工具箱114
61 数据加载王者GPLoad114
611 GPLoad简介114
612 GPLoad配置详解116
613 GPLoad实战118
62 自定义存储过程120
621 存储过程介绍 120
622 存储过程应用模板121
623 存储过程精选案例122
63 PXF插件131
631 PXF简介131
632 安装PXF132
633 PXF实战135
64 DBLink136
641 DBLink简介136
642 安装DBLink137
643 DBlink实战139
65 拉链表142
第7章 Greenplum高级应用147
71 开放的编程接口147
711 PL/Python148
712 PL/R150
72 MADlib机器学习库153
721 安装MADlib154
722 线性回归案例157
723 关联规则案例158
724 朴素贝叶斯分类案例159
73 半结构化数据分析164
74 地理空间数据分析166
75 图计算应用168
第8章 Greenplum运维管理和监控172
81 数据库管理172
811 创建和管理数据库172
812 创建和管理模式173
813 创建和管理表空间175
814 创建和管理用户178
815 创建和管理资源队列180
82 可视化监控页面—GPCC183
83 管理好帮手—gp_toolkit185
84 Greenplum备份和恢复187
85 在线扩容工具GPExpand189
851 Greenplum扩容实战189
852 扩容原理分析191
86 锁机制192
861 锁管理概述192
862 普通锁数据结构192
第9章 Greenplum性能优化197
91 系统级优化197
911 操作系统选择197
912 硬件资源配置198
913 磁盘读写199
914 节点之间的网络带宽202
915 系统参数202
92 数据库级优化204
921 数据库参数配置204
922 资源队列206
93 表级优化206
931 建表参数207
932 表的优化208
94 执行计划和查询优化209
941 查看执行计划210
942 数据扫描方式210
943 分布式执行方式213
944 两种聚合方式214
945 关联分类214
946 优化器的选择216
947 其他关键术语217
第10章 Greenplum与开源组件220
101 Kettle220
102 DataX224
103 HDFS、Hive和HBase228
104 Spark230
105 Kafka235
106 Flink238
第11章 Greenplum与BI应用244
111 Tableau244
猜您喜欢

读书导航