书籍详情
大数据技术导论
作者:樊继慧,李旭耀
出版社:中国水利水电出版社
出版时间:2022-12-01
ISBN:9787522611013
定价:¥32.00
购买这本书可以去
内容简介
本书根据现有的大数据技术理论,综合介绍了大数据技术的相关基础理论知识,并提供了部分实践操作介绍。本书共8个章节,内容包含大数据的概念和特征,大数据计量,大数据生命周期,大数据与云计算,Hadoop,HDFS,MapReduce,大数据编程语言Python、Spark、R语言,数据预处理,聚类分析,k-邻近分类算法,数据可视化,大数据应用,大数据安全与威胁,爬虫技术,MINIST数字识别技术。本书分别在大数据采集与预处理、数据挖掘与分析等重要章节中安排了入门级的实践操作内容,以便读者 好地学习和掌握大数据关键技术。本书可以作为高等院校数据科学与大数据等相关专业的课程教材,亦可作为大数据爱好者的科普读物。
作者简介
暂缺《大数据技术导论》作者简介
目录
前言
第1章 概论
1.1 揭秘大数据
1.1.1 大数据概念和特征
1.1.2 大数据的计量
1.1.3 大数据生命周期
1.1.4 大数据与云计算
1.1.5 大数据时代的重大变革
1.2 大数据关键技术
练习1
第2章 大数据生态系统
2.1 Hadoop
2.1.1 Hadoop简介
2.1.2 Hadoop优势
2.2 HDFS
2.2.1 HDFS体系结构
2.2.2 HDFS存储原理
2.2.3 HDFS常用操作
2.3 MapReduce
2.3.1 MapReduce简介
2.3.2 MapReduce的适用场景
2.3.3 MapReduce的优点和缺点
2.4 大数据编程语言
2.4.1 Python
2.4.2 Spark
2.4.3 R语言
练习2
第3章 大数据采集与预处理
3.1 数据采集
3.1.1 数据采集分类
3.1.2 数据采集方法
3.1.3 数据采集工具
3.2 数据清洗
3.2.1 数据清洗任务
3.2.2 数据清洗过程
3.3 数据变换
3.3.1 规范化
3.3.2 数据变换分类
3.4 数据分析与采集实例:线性回归和逻辑回归
练习3
第4章 数据挖掘与分析
4.1 大数据分析概述
4.1.1 数据分析原则
4.1.2 大数据分析特点
4.1.3 大数据分析流程
4.1.4 数据分析师基本技能和素质
4.1.5 大数据分析难点
4.2 数据认知
4.2.1 数据预处理
4.2.2 概率分析
第1章 概论
1.1 揭秘大数据
1.1.1 大数据概念和特征
1.1.2 大数据的计量
1.1.3 大数据生命周期
1.1.4 大数据与云计算
1.1.5 大数据时代的重大变革
1.2 大数据关键技术
练习1
第2章 大数据生态系统
2.1 Hadoop
2.1.1 Hadoop简介
2.1.2 Hadoop优势
2.2 HDFS
2.2.1 HDFS体系结构
2.2.2 HDFS存储原理
2.2.3 HDFS常用操作
2.3 MapReduce
2.3.1 MapReduce简介
2.3.2 MapReduce的适用场景
2.3.3 MapReduce的优点和缺点
2.4 大数据编程语言
2.4.1 Python
2.4.2 Spark
2.4.3 R语言
练习2
第3章 大数据采集与预处理
3.1 数据采集
3.1.1 数据采集分类
3.1.2 数据采集方法
3.1.3 数据采集工具
3.2 数据清洗
3.2.1 数据清洗任务
3.2.2 数据清洗过程
3.3 数据变换
3.3.1 规范化
3.3.2 数据变换分类
3.4 数据分析与采集实例:线性回归和逻辑回归
练习3
第4章 数据挖掘与分析
4.1 大数据分析概述
4.1.1 数据分析原则
4.1.2 大数据分析特点
4.1.3 大数据分析流程
4.1.4 数据分析师基本技能和素质
4.1.5 大数据分析难点
4.2 数据认知
4.2.1 数据预处理
4.2.2 概率分析
猜您喜欢