书籍详情
Flink入门与实战
作者:汪明 著
出版社:清华大学出版社
出版时间:2021-08-01
ISBN:9787302583813
定价:¥89.00
购买这本书可以去
内容简介
ApacheFlink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态的计算,广泛应用于大数据相关的实际业务场景中。《Flink入门与实战/大数据技术丛书》是一本从零开始讲解Flink的入门教材,学习《Flink入门与实战/大数据技术丛书》需要有Java编程基础。《Flink入门与实战/大数据技术丛书》共分10章,内容包括Flink开发环境搭建、Flink架构和原理、时间和窗口、状态管理和容错机制、数据类型与序列化、DataStreamAPI和DataSetAPI、TableAPI和SQL、Flink并行、Flink部署与应用,最后以一个Flink实战项目为例,对Flink相关知识进行综合实践,其中涉及Web页面展示、WebSocket协议和Node.js服务等技术。《Flink入门与实战/大数据技术丛书》内容详尽、示例丰富,适合作为Flink初学者必备的参考书,也非常适合作为高等院校和培训机构大数据及相关专业的师生教学参考。《Flink入门与实战/大数据技术丛书》针对Flink初学者,详细介绍Flink架构、原理、大数据处理机制和处理方法,以及Flink并行、部署与集群等方面的知识,最后通过—个实战项目来提高读者解决实际问题的能力。
作者简介
汪明,中国矿业大学硕士,徐州软件协会副理事长,某创业公司合伙人。从事软件行业十余年,发表论文数十篇。著有图书《Python大数据处理库PySpark实战》《TypeScript实战》《Go并发编程实战》。
目录
第1章 Flink环境搭建
1.1 下载安装
1.1.1 什么是Flink
1.1.2 Flink用户
1.1.3 JDK安装
1.1.4 Scala安装
1.1.5 Python安装
1.1.6 FinalShell安装
1.2 配置与开发工具
1.2.1 基础配置
1.2.2 IDEA开发工具
1.3 编译
1.3.1 Scala项目模板
1.3.2 Java项目模板
1.3.3 Python项目
1.3.4 项目编译
1.4 运行Flink应用
1.4.1 单机Standalone模式
1.4.2 多机Standalone模式
1.4.3 OnYam集群模式
1.5 本章小结
第2章 定义、架构与原理
2.1 流处理的应用场景
2.1.1 数据预处理场景
2.1.2 预警场景
2.1.3 实时数量统计场景
2.1.4 数据库交互场景
2.1.5 跟踪场景
2.1.6 基于数据流的机器学习场景
2.1.7 实时自动控制场景
2.2 流处理的原理
2.2.1 流数据特征
2.2.2 Dataflow模型
2.2.3 数据流图
2.2.4 流处理操作
2.2.5 窗口操作
2.3 Flink架构分析
2.3.1 Flink常见概念
2.3.2 Flink主从架构
2.3.3 任务和算子链
2.4 Flink中的几个语义——Streams、State、Time、API
2.4.1 Streams流
2.4.2 State状态
2.4.3 Time时间
2.4.4 API接口
2.5 Flink组件
2.6 本章小结
……
第3章 时间和窗口
第4章 状态管理及容错机制
第5章 数据类型与序列化
第6章 DataStreamAPI和DataSetAPI
第7章 TableAPI和SQL
第8章 并行
第9章 Flink部署与应用
第10章 Flink项目实战
1.1 下载安装
1.1.1 什么是Flink
1.1.2 Flink用户
1.1.3 JDK安装
1.1.4 Scala安装
1.1.5 Python安装
1.1.6 FinalShell安装
1.2 配置与开发工具
1.2.1 基础配置
1.2.2 IDEA开发工具
1.3 编译
1.3.1 Scala项目模板
1.3.2 Java项目模板
1.3.3 Python项目
1.3.4 项目编译
1.4 运行Flink应用
1.4.1 单机Standalone模式
1.4.2 多机Standalone模式
1.4.3 OnYam集群模式
1.5 本章小结
第2章 定义、架构与原理
2.1 流处理的应用场景
2.1.1 数据预处理场景
2.1.2 预警场景
2.1.3 实时数量统计场景
2.1.4 数据库交互场景
2.1.5 跟踪场景
2.1.6 基于数据流的机器学习场景
2.1.7 实时自动控制场景
2.2 流处理的原理
2.2.1 流数据特征
2.2.2 Dataflow模型
2.2.3 数据流图
2.2.4 流处理操作
2.2.5 窗口操作
2.3 Flink架构分析
2.3.1 Flink常见概念
2.3.2 Flink主从架构
2.3.3 任务和算子链
2.4 Flink中的几个语义——Streams、State、Time、API
2.4.1 Streams流
2.4.2 State状态
2.4.3 Time时间
2.4.4 API接口
2.5 Flink组件
2.6 本章小结
……
第3章 时间和窗口
第4章 状态管理及容错机制
第5章 数据类型与序列化
第6章 DataStreamAPI和DataSetAPI
第7章 TableAPI和SQL
第8章 并行
第9章 Flink部署与应用
第10章 Flink项目实战
猜您喜欢