书籍详情
理论与实践:图数据库
作者:张晨 吴菁 周研 著
出版社:电子工业出版社
出版时间:2024-01-01
ISBN:9787121470431
定价:¥168.00
购买这本书可以去
内容简介
本书系统论述了图数据库的理论知识与行业应用实践。本书分为理论篇和实践篇,共15章。其中,理论篇包括第1~8章,由浅入深地介绍了图数据库的概念和底层技术原理,涵盖主流图数据库的内核原理与架构设计、图查询语言、图算法 、图数据库客户端编程、图数据库服务端编程、图可视化、图数据库选型等内容;实践篇包括第9~15章,介绍了图数据库的行业应用案例,涵盖知识图谱、金融、泛政府、零售、制造业供应链管理、企业资产管理、生命科学等内容,通过这些案例,进一步启发读者深入思考和挖掘潜在的应用场景。针对行业案例,本书免费提供详尽的源代码,以便读者动手实践。 本书适合数据库应用开发人员、数据库管理人员、数据科学家以及负责数据库选型的技术专家阅读,也适合高等院校数据库专业的高年级本科生和研究生参考。
作者简介
张晨,创邻科技创始人兼CEO,国家特聘专家,中国计算机学会(CCF)信息系统专委会执委,北京理工大学校外博导,香港科技大学(广州)实践副教授、图数据实验室联席主任,正高级工程师,浙江大学竺可桢学院计算机科学与技术学士、加拿大滑铁卢大学计算机科学博士、麦吉尔大学博士后,图数据库、分布式系统及并行计算领域专家,近20年分布式并行系统研发经历。曾任美国运通大数据科学家、硅谷初创Splice Machine软件架构师、加拿大初创Graph Intelligence联合创始人。 吴菁,麦吉尔大学管理信息系统博士,荷兰莱顿大学ICT in Business硕士,浙江大学竺可桢学院计算机科学与技术学士。图分析领域专家,现任浙江创邻科技有限公司联合创始人兼COO,加拿大初创Graph Intelligence联合创始人兼执行董事,近10年图技术商业转化及解决方案咨询落地经验,曾获评创业邦2022最值得关注的女性创业者。 周研,本科毕业于浙江大学竺可桢学院混合班,博士毕业于浙江大学计算机学院,师从陈纯院士。曾为Apache开源项目贡献者,具有10余年大型软件项目的研发和管理经历。图数据库和分布式系统领域的专家,现浙江创邻科技有限公司联合创始人兼CTO,承担多个图计算领域省级、市级重大研发专项项目,是图数据库、知识图谱领域国内外多个标准化委员会成员,主导/参与制定多项行业标准。
目录
目录
理 论 篇
第1 章 初识图数据库 / 3
1.1 图数据库的发展背景 / 3
1.1.1 什么是图 / 5
1.1.2 理解图的手段:图分析 / 7
1.2 图技术 / 10
1.2.1 图计算引擎 / 10
1.2.2 图数据库 / 11
1.2.3 图可视化 / 13
1.3 图数据库技术的优势 / 15
1.4 图数据库的分类 / 22
1.5 图数据库的应用场景 / 25
1.6 图数据库与知识图谱 / 32
1.7 图技术的发展趋势 / 32
1.8 本章小结 / 35
第2 章 主流图数据库的内核原理与架构设计 / 37
2.1 图数据库内核设计的关键目标 / 37
2.1.1 免索引邻接 / 38
2.1.2 图数据库内核的分类 / 38
2.2 实现免索引邻接的技术方案 / 40
2.2.1 使用数组结构存储 / 40
2.2.2 使用链表结构存储 / 41
2.2.3 使用LSM 树或其他键值形式存储 / 42
2.2.4 优化之路 / 44
2.3 Neo4j / 45
2.3.1 Neo4j 存储结构 / 45
2.3.2 Neo4j 事务 / 47
2.3.3 Neo4j 集群 / 48
2.4 JanusGraph / 50
2.4.1 JanusGraph 存储结构 / 50
2.4.2 JanusGraph 事务 / 53
2.4.3 JanusGraph 架构 / 53
2.5 Galaxybase / 54
2.5.1 Galaxybase 系统架构 / 55
2.5.2 Galaxybase 分布式图存储 / 56
2.5.3 Galaxybase 分布式图计算 / 58
2.5.4 Galaxybase 高性能图展示 / 61
2.6 本章小结 / 62
第3 章 图查询语言 / 63
3.1 图查询语言一览 / 63
3.2 Cypher / 65
3.2.1 Cypher 简介 / 65
3.2.2 Cypher 使用场景 / 66
3.2.3 Cypher 高级特性 / 75
3.3 本章小结 / 81
第4 章 图算法 / 82
4.1 图算法概述 / 82
4.2 寻路算法 / 83
4.2.1 数据准备 / 84
4.2.2 算法介绍 / 85
4.3 中心性算法 / 97
4.3.1 数据准备 / 97
4.3.2 算法介绍 / 98
4.4 社区检测算法 / 110
4.4.1 数据准备 / 111
4.4.2 算法介绍 / 112
4.5 相似度算法 / 122
4.5.1 数据准备 / 123
4.5.2 算法介绍 / 124
4.6 图模式匹配算法 / 132
4.6.1 环路匹配 / 133
4.6.2 路径匹配 / 134
4.6.3 复杂子图 / 136
4.7 图嵌入算法 / 138
4.8 图神经网络算法 / 144
4.9 分布式并行图计算 / 153
4.9.1 分布式图计算框架 / 153
4.9.2 分布式图计算面临的挑战 / 155
4.10 图算法的综合应用 / 157
4.10.1 标准图算法的应用 / 158
4.10.2 定制化图算法的应用 / 161
4.11 本章小结 / 163
参考文献 / 164
第5 章 图数据库客户端编程 / 166
5.1 概述 / 167
5.2 驱动模式 / 168
5.2.1 Java / 169
5.2.2 Python / 175
5.2.3 Go / 180
5.3 RESTful API / 185
5.3.1 登录 / 185
5.3.2 图列表查询 / 186
5.3.3 图模型操作 / 187
5.3.4 点操作 / 192
5.3.5 边操作 / 198
5.3.6 遍历操作 / 201
5.3.7 执行Cypher 语句 / 203
5.4 本章小结 / 204
第6 章 图数据库服务端编程 / 205
6.1 概述 / 205
6.2 Galaxybase PAR API
简介 / 207
6.3 PAR 的使用方法 / 208
6.4 PAR 的自定义函数 / 209
6.4.1 自定义非聚合函数 / 209
6.4.2 自定义聚合函数 / 210
6.5 PAR 的自定义过程 / 212
6.5.1 自定义本机过程示例 / 212
6.5.2 自定义集群过程示例 / 213
6.6 PAR 的自定义过程封装 / 215
6.6.1 PARKit / 215
6.6.2 Traversal API / 222
6.7 PAR 管理接口 / 226
6.7.1 查询 / 226
6.7.2 删除 / 227
6.8 本章小结 / 228
第7 章 图可视化 / 229
7.1 图可视化在不同领域的应用 / 229
7.2 通用图可视化工具 / 230
7.3 图可视化框架 / 236
7.4 基于图数据库的可视化平台 / 242
7.5 Galaxybase Studio 图可视化平台 / 243
7.5.1 创建图项目 / 243
7.5.2 图项目管理 / 250
7.5.3 数据源管理 / 252
7.5.4 图可视化分析 / 253
7.5.5 用户管理 / 273
7.5.6 图挖掘 / 274
7.6 本章小结 / 275
第8 章 图数据库选型 / 276
8.1 图数据库的应用场景 / 276
8.1.1 图分析需求:OLTP 还是OLAP / 276
8.1.2 图数据特点 / 278
8.2 图数据库的存储架构 / 280
8.3 图数据库的性能 / 280
8.3.1 导入性能 / 281
8.3.2 查询性能 / 282
8.3.3 图算法性能 / 283
8.3.4 正确性验证 / 285
8.4 图数据库的功能 / 286
8.4.1 基础图数据库功能 / 286
8.4.2 高阶图数据库功能 / 289
8.4.3 可视化分析与查询 / 290
8.5 图数据库选型基准测试 / 291
8.6 图数据库选型测试方案样例 / 296
8.6.1 测试说明 / 296
8.6.2 测试用例 / 297
8.7 本章小结 / 320
实 践 篇
第9 章 知识图谱 / 323
9.1 背景 / 323
9.2 影视知识图谱 / 324
第10 章 金融 / 333
10.1 信用卡申请反欺诈 / 333
10.2 小微信贷风控 / 339
10.3 反洗钱 / 346
第11 章 泛政府 / 353
11.1 社会治安 / 353
11.2 疫情防控 / 359
11.3 电力调度 / 362
11.4 武器设备管理 / 365
第12 章 零售 / 369
12.1 商品推荐 / 369
12.2 社交网络营销 / 376
第13 章 制造业供应链管理 / 382
13.1 供应链风险管理 / 382
13.2 物流管理 / 393
第14 章 企业资产管理 / 400
14.1 网络安全 / 400
14.2 权限管理 / 404
14.3 设备资产管理之智能运维 / 409
第15 章 生命科学 / 414
15.1 农业育种 / 414
15.2 新药研发 / 418
理 论 篇
第1 章 初识图数据库 / 3
1.1 图数据库的发展背景 / 3
1.1.1 什么是图 / 5
1.1.2 理解图的手段:图分析 / 7
1.2 图技术 / 10
1.2.1 图计算引擎 / 10
1.2.2 图数据库 / 11
1.2.3 图可视化 / 13
1.3 图数据库技术的优势 / 15
1.4 图数据库的分类 / 22
1.5 图数据库的应用场景 / 25
1.6 图数据库与知识图谱 / 32
1.7 图技术的发展趋势 / 32
1.8 本章小结 / 35
第2 章 主流图数据库的内核原理与架构设计 / 37
2.1 图数据库内核设计的关键目标 / 37
2.1.1 免索引邻接 / 38
2.1.2 图数据库内核的分类 / 38
2.2 实现免索引邻接的技术方案 / 40
2.2.1 使用数组结构存储 / 40
2.2.2 使用链表结构存储 / 41
2.2.3 使用LSM 树或其他键值形式存储 / 42
2.2.4 优化之路 / 44
2.3 Neo4j / 45
2.3.1 Neo4j 存储结构 / 45
2.3.2 Neo4j 事务 / 47
2.3.3 Neo4j 集群 / 48
2.4 JanusGraph / 50
2.4.1 JanusGraph 存储结构 / 50
2.4.2 JanusGraph 事务 / 53
2.4.3 JanusGraph 架构 / 53
2.5 Galaxybase / 54
2.5.1 Galaxybase 系统架构 / 55
2.5.2 Galaxybase 分布式图存储 / 56
2.5.3 Galaxybase 分布式图计算 / 58
2.5.4 Galaxybase 高性能图展示 / 61
2.6 本章小结 / 62
第3 章 图查询语言 / 63
3.1 图查询语言一览 / 63
3.2 Cypher / 65
3.2.1 Cypher 简介 / 65
3.2.2 Cypher 使用场景 / 66
3.2.3 Cypher 高级特性 / 75
3.3 本章小结 / 81
第4 章 图算法 / 82
4.1 图算法概述 / 82
4.2 寻路算法 / 83
4.2.1 数据准备 / 84
4.2.2 算法介绍 / 85
4.3 中心性算法 / 97
4.3.1 数据准备 / 97
4.3.2 算法介绍 / 98
4.4 社区检测算法 / 110
4.4.1 数据准备 / 111
4.4.2 算法介绍 / 112
4.5 相似度算法 / 122
4.5.1 数据准备 / 123
4.5.2 算法介绍 / 124
4.6 图模式匹配算法 / 132
4.6.1 环路匹配 / 133
4.6.2 路径匹配 / 134
4.6.3 复杂子图 / 136
4.7 图嵌入算法 / 138
4.8 图神经网络算法 / 144
4.9 分布式并行图计算 / 153
4.9.1 分布式图计算框架 / 153
4.9.2 分布式图计算面临的挑战 / 155
4.10 图算法的综合应用 / 157
4.10.1 标准图算法的应用 / 158
4.10.2 定制化图算法的应用 / 161
4.11 本章小结 / 163
参考文献 / 164
第5 章 图数据库客户端编程 / 166
5.1 概述 / 167
5.2 驱动模式 / 168
5.2.1 Java / 169
5.2.2 Python / 175
5.2.3 Go / 180
5.3 RESTful API / 185
5.3.1 登录 / 185
5.3.2 图列表查询 / 186
5.3.3 图模型操作 / 187
5.3.4 点操作 / 192
5.3.5 边操作 / 198
5.3.6 遍历操作 / 201
5.3.7 执行Cypher 语句 / 203
5.4 本章小结 / 204
第6 章 图数据库服务端编程 / 205
6.1 概述 / 205
6.2 Galaxybase PAR API
简介 / 207
6.3 PAR 的使用方法 / 208
6.4 PAR 的自定义函数 / 209
6.4.1 自定义非聚合函数 / 209
6.4.2 自定义聚合函数 / 210
6.5 PAR 的自定义过程 / 212
6.5.1 自定义本机过程示例 / 212
6.5.2 自定义集群过程示例 / 213
6.6 PAR 的自定义过程封装 / 215
6.6.1 PARKit / 215
6.6.2 Traversal API / 222
6.7 PAR 管理接口 / 226
6.7.1 查询 / 226
6.7.2 删除 / 227
6.8 本章小结 / 228
第7 章 图可视化 / 229
7.1 图可视化在不同领域的应用 / 229
7.2 通用图可视化工具 / 230
7.3 图可视化框架 / 236
7.4 基于图数据库的可视化平台 / 242
7.5 Galaxybase Studio 图可视化平台 / 243
7.5.1 创建图项目 / 243
7.5.2 图项目管理 / 250
7.5.3 数据源管理 / 252
7.5.4 图可视化分析 / 253
7.5.5 用户管理 / 273
7.5.6 图挖掘 / 274
7.6 本章小结 / 275
第8 章 图数据库选型 / 276
8.1 图数据库的应用场景 / 276
8.1.1 图分析需求:OLTP 还是OLAP / 276
8.1.2 图数据特点 / 278
8.2 图数据库的存储架构 / 280
8.3 图数据库的性能 / 280
8.3.1 导入性能 / 281
8.3.2 查询性能 / 282
8.3.3 图算法性能 / 283
8.3.4 正确性验证 / 285
8.4 图数据库的功能 / 286
8.4.1 基础图数据库功能 / 286
8.4.2 高阶图数据库功能 / 289
8.4.3 可视化分析与查询 / 290
8.5 图数据库选型基准测试 / 291
8.6 图数据库选型测试方案样例 / 296
8.6.1 测试说明 / 296
8.6.2 测试用例 / 297
8.7 本章小结 / 320
实 践 篇
第9 章 知识图谱 / 323
9.1 背景 / 323
9.2 影视知识图谱 / 324
第10 章 金融 / 333
10.1 信用卡申请反欺诈 / 333
10.2 小微信贷风控 / 339
10.3 反洗钱 / 346
第11 章 泛政府 / 353
11.1 社会治安 / 353
11.2 疫情防控 / 359
11.3 电力调度 / 362
11.4 武器设备管理 / 365
第12 章 零售 / 369
12.1 商品推荐 / 369
12.2 社交网络营销 / 376
第13 章 制造业供应链管理 / 382
13.1 供应链风险管理 / 382
13.2 物流管理 / 393
第14 章 企业资产管理 / 400
14.1 网络安全 / 400
14.2 权限管理 / 404
14.3 设备资产管理之智能运维 / 409
第15 章 生命科学 / 414
15.1 农业育种 / 414
15.2 新药研发 / 418
猜您喜欢