大数据应用部署与调优
作者:刘鹏,李肖俊
出版社:清华大学出版社
出版时间:2022-07-01
ISBN:9787302609971
定价:¥69.00
目 录
\n第1 章 大数据导论
\n1.1 大数据的概念 ·
\n1.1.1 大数据的来源
\n1.1.2 大数据的分类
\n1.2 大数据的特征
\n1.2.1 数量(volume)
\n1.2.2 多样性(variety)
\n1.2.3 速度(velocity)
\n1.2.4 价值(value)
\n1.3 大数据关键技术
\n1.3.1 大数据存储技术
\n1.3.2 并行计算技术
\n1.3.3 数据分析技术
\n1.3.4 数据可视化技术
\n1.3.5 数据挖掘技术
\n1.4 大数据应用场景
\n1.4.1 电商行业大数据应用
\n1.4.2 金融行业大数据应用
\n1.4.3 医疗行业大数据应用
\n1.4.4 教育行业大数据应用
\n1.4.5 工业大数据应用
\n1.4.6 农业大数据应用
\n1.4.7 环境大数据应用
\n1.4.8 智慧城市大数据应用
\n习题
\n参考文献
\n第2 章 基础云架构
\n2.1 云计算简介
\nX 大数据应用部署与调优
\n2.1.1 云计算的概念
\n2.1.2 云计算发展现状
\n2.1.3 云计算实现机制
\n2.1.4 云计算部署模型
\n2.2 云计算与大数据
\n2.2.1 云计算与大数据的关系
\n2.2.2 云计算与大数据相结合的优势
\n2.3 私有云平台OpenStack
\n2.3.1 OpenStack 背景介绍
\n2.3.2 计算服务Nova
\n2.3.3 对象存储服务Swift ·
\n2.3.4 镜像服务Glance
\n2.4 公有云平台阿里云
\n2.4.1 阿里云简介
\n2.4.2 计算服务ECS
\n2.4.3 存储服务
\n2.4.4 网络服务VPC
\n习题
\n参考文献
\n第3 章 大数据业务流程
\n3.1 数据采集
\n3.1.1 数据采集的概念
\n3.1.2 数据采集的工具
\n3.1.3 数据采集的方法
\n3.2 数据预处理ETL
\n3.2.1 数据清洗
\n3.2.2 数据集成
\n3.2.3 数据转换
\n3.2.4 数据归约
\n3.2.5 常用ETL 工具
\n3.3 大数据存储
\n3.3.1 大数据存储困境
\n3.3.2 大数据存储中的数据结构处理样例 ·
\n目录 XI
\n3.3.3 分布式系统 ·
\n3.3.4 Hadoop 框架
\n3.3.5 NoSQL 数据库
\n3.3.6 云存储
\n3.4 大数据处理
\n3.4.1 大数据处理框架
\n3.4.2 批处理系统 ·
\n3.4.3 流处理系统 ·
\n3.4.4 混合处理系统
\n3.4.5 大数据处理框架的选择
\n3.5 环境监控大数据应用实例
\n习题
\n参考文献
\n第4 章 系统安装部署 ·
\n4.1 安装部署的概念
\n4.1.1 软件安装概述
\n4.1.2 大数据部署概述
\n4.2 安装部署分布式系统
\n4.2.1 Hadoop 安装部署 ·
\n4.2.2 Spark 部署
\n4.3 升级管理
\n4.3.1 系统升级的概念
\n4.3.2 Hadoop 升级管理
\n4.3.3 Spark 升级管理 ·
\n习题
\n参考文献
\n第5 章 日常维护管理
\n5.1 系统管理对象 ·
\n5.1.1 系统软件
\n5.1.2 系统硬件
\n5.1.3 系统数据
\nXII 大数据应用部署与调优
\n5.2 系统管理的内容
\n5.2.1 事件管理
\n5.2.2 问题管理
\n5.2.3 故障管理
\n5.2.4 性能管理
\n5.2.5 配置管理
\n5.2.6 日志管理
\n5.2.7 备份管理
\n5.3 故障管理
\n5.3.1 集群结构
\n5.3.2 故障报告
\n5.3.3 故障处理
\n5.3.4 故障后期管理
\n5.4 性能管理
\n5.4.1 性能监控
\n5.4.2 性能分析
\n5.5 日志管理
\n5.5.1 平台及组件相关命令行 ·
\n5.5.2 日志和告警监控
\n5.6 日常巡检
\n5.6.1 检查内容分类
\n5.6.2 巡检方法分类
\n5.6.3 巡检流程
\n5.7 系统管理制度规范
\n5.7.1 系统管理标准
\n5.7.2 系统管理制度
\n5.7.3 系统管理规范
\n习题
\n参考文献
\n第6 章 高级系统运维
\n6.1 安全管理
\n6.1.1 资产安全
\n6.1.2 应用安全
\n目录 XIII
\n6.1.3 安全威胁
\n6.1.4 安全措施
\n6.2 系统优化
\n6.2.1 Hadoop 配置优化
\n6.2.2 Hadoop 性能优化
\n6.2.3 作业优化
\n6.3 高可用
\n6.3.1 高可用概述
\n6.3.2 高可用技术
\n6.3.3 业务连续性
\n习题
\n参考文献
\n第7 章 基础应用开发
\n7.1 Python 简介
\n7.1.1 Python 的前世今生
\n7.1.2 Python 的应用场合
\n7.1.3 Python 的特性
\n7.2 Python 语法
\n7.2.1 Python 赋值语句
\n7.2.2 顺序结构
\n7.2.3 选择结构
\n7.2.4 循环结构
\n7.2.5 绘图(用matplotlib 等新库)
\n7.2.6 函数
\n7.2.7 常用模块
\n7.3 Python 程序调试
\n7.3.1 拼接字符串
\n7.3.2 使用 generator
\n7.3.3 死循环
\n7.3.4 巧用多重赋值
\n7.3.5 使用C 扩展(extension)
\n7.3.6 并行编程
\n习题
\nXIV 大数据应用部署与调优
\n参考文献
\n第8 章 大数据应用开发
\n8.1 数据获取
\n8.1.1 通过传感器采集数据
\n8.1.2 通过API 获取数据
\n8.1.3 网络信息抓取
\n8.1.4 通过网络信息系统获取数据 ·
\n8.2 数据分析
\n8.2.1 数据分析概念和分类
\n8.2.2 数据分析方法
\n8.3 数据可视化
\n8.3.1 数据可视化基础
\n8.3.2 大数据可视化方法
\n8.4 应用案例开发
\n8.4.1 案例一 Python 数据分析:商圈分析 ·
\n8.4.2 案例二 Python 数据分析:招聘信息可视化案例
\n习题
\n参考文献
\n附录A 大数据和人工智能实验环境
\n