书籍详情

数据浪潮:大数据技术演进之路

数据浪潮:大数据技术演进之路

作者:吴垚

出版社:人民邮电出版社

出版时间:2022-09-01

ISBN:9787115579249

定价:¥89.80

购买这本书可以去
内容简介
  近年来,基础软件的发展越来越受到重视,越来越多的计算机从业者对数据管理系统和大数据的知识产生了强烈的需求。本书既介绍了数据管理系统的技术发展史,又介绍了数据管理系统的关键技术内涵,同时还介绍了一系列主流的商业化产品及其架构,并对前沿技术进行了讨论分析,给出作者自己的见解和洞察。本书内容主要包括数据库与大数据的诞生、发展和商业应用,数据库与大数据之间的关系,国产数据库的国际化,数据管理系统的共同之处,数据管理系统的算法理论、前沿技术等。本书适合数据管理系统或大数据方向的技术人员和科研人员阅读,也适合互联网科技公司的技术人员及管理人员,以及对特定领域的商业和历史感兴趣的读者阅读。
作者简介
  吴垚,毕业于中国人民大学,是中国人民大学和加利福尼亚大学尔湾分校(UCI)联合培养的博士,目前就职于华为公司加拿大研究院。其国内导师陈红是CCF数据库专委委员,国家科技进步二等奖获得者;国外导师Michael J. Carey是美国工程院院士、ACM和IEEE Fellow。博士在读期间作者参与的项目包括:物联网搜索中的隐私保护研究、新一代高时效安全可靠流数据系统、“Big Active Data:From Petabyte Data to Million People”等。毕业后就职于华为高斯部门,先后在高斯产品部、高斯实验室和多伦多实验室工作,在GaussDB、XY Kernel、HP Kernel等项目中参与AP数据库、AI数据库、TP数据库的研发。
目录
第 1篇 数据管理系统之数据库——掌上明珠

第 1章 数据库的诞生——“图灵”奖经典人物 3
1.1 网状数据管理系统 4
1.2 关系数据库模型 6
1.3 数据库并发与事务 8
1.4 数据库优化与实践 10
1.5 小结 13
1.6 参考资料 13
第 2章 数据库的工业繁荣——商业机遇 14
2.1 System R 14
2.2 PostgreSQL 16
2.3 Oracle 18
2.4 MySQL 20
2.5 IBM Db2 23
2.6 SQL Server 27
2.7 小结 29
2.8 参考资料 30
第3章 国产数据库的热潮——四大家族 31
3.1 人大金仓 31
3.2 南大通用 32
3.3 武汉达梦 32
3.4 神舟通用 33
3.5 小结 34
3.6 参考资料 35

第 2篇 数据管理系统之大数据——异军突起

第4章 大数据降临——生逢其时 39
4.1 Google的“三驾马车” 39
4.1.1 GFS 40
4.1.2 MapReduce系统 41
4.1.3 Bigtable系统 42
4.2 Amazon的“云上时代” 43
4.3 Facebook的“社交帝国” 44
4.4 LinkedIn的“职业摇篮” 46
4.5 学术界的徘徊辗转 48
4.6 小结 49
4.7 参考资料 49
第5章 大数据分布式系统——高潮迭起 50
5.1 容错内存迭代式计算 50
5.2 实时流式大数据计算 52
5.2.1 Storm系统 52
5.2.2 Flink系统 53
5.3 大规模机器学习系统 54
5.4 数据中心的资源管理 56
5.5 全球分布式数据服务 58
5.6 小结 59
5.7 参考资料 59
第6章 开源整合架构演进——融会贯通 60
6.1 链家架构演进 60
6.1.1 大数据平台架构演进 60
6.1.2 日志平台设计与技术 61
6.2 美团架构演进 62
6.2.1 由浅入深架构解析 62
6.2.2 基础系统架构演进 64
6.3 Airbnb架构演进 65
6.3.1 大数据平台架构解析 65
6.3.2 平台发展的经验和教训 66
6.4 58同城架构演进 68
6.4.1 大数据三层平台架构 68
6.4.2 关键技术演进与实现 70
6.5 滴滴出行架构演进 71
6.5.1 实时计算平台架构演进 71
6.5.2 实时计算平台架构 72
6.6 小米架构演进 73
6.6.1 流式平台整体架构 73
6.6.2 3个阶段的演进历程 74
6.7 小结 77
6.8 参考资料 77
第7章 大数据的魅力——广泛应用 78
7.1 工业应用 78
7.2 银行金融 79
7.3 智慧城市 81
7.4 健康医疗 82
7.5 小结 83
7.6 参考资料 84

第3篇 大数据管理系统——谁主沉浮

第8章 数据库与大数据之战——华山论剑 87
8.1 ACM双方论战 87
8.2 MPP绝对优势 89
8.3 大数据强势发展 91
8.4 数据库自我革命 94
8.5 NewSQL兼容并包 96
8.6 老牌数据库的反击 99
8.7 小结 101
8.8 参考资料 102
第9章 大数据管理系统——求同存异 103
9.1 Hadoop生态 104
9.2 BDAS平台 105
9.3 AsterixDB系统 106
9.4 Apache Beam框架 108
9.5 SnappyData模型 109
9.6 SageDB愿景 110
9.7 ShardingSphere项目 112
9.8 小结 114
9.9 参考资料 115
第 10章 新型数据管理系统——百花齐放 116
10.1 大数据输入和输出 116
10.2 大数据调度管控 119
10.3 大数据用户交互 123
10.4 大数据安全隐私 124
10.5 大数据新型引擎 127
10.6 大数据通用语言 129
10.7 大数据网络赋能 130
10.8 小结 134
10.9 参考资料 135
第 11章 国产数据库的国际化——齐头并进 137
11.1 TiDB 137
11.1.1 研发背景 137
11.1.2 早期架构 138
11.1.3 架构升级 139
11.1.4 稳定架构 140
11.2 OceanBase 142
11.2.1 设计考量 142
11.2.2 架构演进 144
11.2.3 厚积薄发 150
11.3 TDSQL 150
11.3.1 分布式TDSQL 150
11.3.2 分析型TBase 152
11.3.3 云原生CynosDB 153
11.3.4 产品战略统一 154
11.4 GaussDB 155
11.4.1 OLTP成长史 155
11.4.2 OLAP成长史 156
11.4.3 HTAP成长史 157
11.4.4 AI-Native成长史 157
11.5 Bigflow 158
11.6 ByteGraph 160
11.7 小结 163
11.8 参考资料 164

第4篇 大数据管理系统的架构——路在何方

第 12章 高速电子计算机与大数据管理系统——万法归宗 167
12.1 以计算为中心的计算机 167
12.2 以存储为中心的数据机 170
12.3 大数据管理的系统模型 172
12.4 数据管理系统的总结抽象 176
12.5 小结 178
12.6 参考资料 179
第 13章 无处不在的操作系统——归纳演绎 180
13.1 计算机的操作系统 180
13.2 数据管理系统的操作系统 184
13.3 数据中心的操作系统 185
13.4 资源抽象与应用接口 189
13.5 小结 192
13.6 参考资料 192
第 14章 大数据管理系统的未来架构——沙漠绿洲 194
14.1 大数据操作系统 195
14.1.1 数据输入 197
14.1.2 数据存储 198
14.1.3 数据计算 200
14.1.4 数据控制 201
14.1.5 数据输出 202
14.2 自动化可插拔引擎 203
14.3 分布式弹性数据模型 203
14.4 易用抽象作业执行框架 204
14.5 深度智能系统管理内核 204
14.6 大数据管理系统biggy原型 204
14.7 小结 205
14.8 参考资料 206

第5篇 大数据管理系统的精髓——无上心法

第 15章 大数据管理系统的基础——算法理论 209
15.1 存储类算法 209
15.1.1 大数据LSM的优势 209
15.1.2 B -Tree与LSM-Tree对比 210
15.1.3 LSM的优化算法 211
15.2 执行器算法 212
15.2.1 Spark RDD中DAG的应用 212
15.2.2 分布式数据库的算子运算 213
15.2.3 大数据DAG与数据库算子的异同 214
15.3 一致性算法 214
15.3.1 常见一致性算法简介 214
15.3.2 Paxos算法进阶深入 215
15.3.3 一致性的Consensus与Consistency 216
15.4 持久化算法 218
15.4.1 经典的WAL 218
15.4.2 前沿的WBL 219
15.5 分布式算法 220
15.5.1 分布式P2P协议 220
15.5.2 一致性哈希算法 220
15.6 事务类算法 222
15.6.1 两阶段提交 222
15.6.2 三阶段提交 223
15.7 分布式容错机制 224
15.7.1 分布式系统容错机制 225
15.7.2 数据库系统容错机制 227
15.7.3 工业实践与学术创新 227
15.8 高并发控制机制 229
15.8.1 并发控制类别 229
15.8.2 并发控制实现 230
15.9 系统健壮性机制 232
15.10 小结 234
15.11 参考资料 234
第 16章 大数据管理系统的前沿——另辟蹊径 236
16.1 数据上下文管理系统Ground 236
16.2 自治数据管理系统Peloton 239
16.3 分布式预测系统Clipper 240
16.4 数据管理中人的作用CrowdDB 241
16.5 新硬件带来的变革doppioDB 242
16.6 端云协同实时数据库Firebase 243
16.7 自组装数据库XuanYuan 245
16.8 数据治理新思路Tamr 248
16.9 系统性能调优AITuning 249
16.10 小结 253
16.11 参考资料 253
第 17章 大数据管理系统的谜团——拨云见日 255
17.1 分布式机器学习与分布式数据库 255
17.2 分布式一致性与数据库一致性 257
17.3 可变的数据与不可变的数据 260
17.4 区块链与数据库的异同 261
17.5 NewSQL与OldSQL 263
17.6 云计算、边缘计算与物联网 266
17.7 大数据Java还是C/C 270
17.8 流数据与批处理的界线 270
17.9 分布式事务与递增式时间 272
17.10 小结 273
17.11 参考资料 274
第 18章 大数据的标准——游戏规则 275
18.1 TPC标准测试 275
18.2 SQL通用语言 277
18.3 顶级学术会议 277
18.4 设计范式 279
18.5 流行趋势 281
18.6 研究机构 283
18.7 小结 284
18.8 参考资料 284
附录 285
A.工业与学术 285
B.国产与国际 286
C.开放与封闭 288
D.资本与技术 292
E.个人与企业 295
F.过去与未来 299
G.参考资料 300

猜您喜欢

读书导航