书籍详情

大数据技术概论

大数据技术概论

作者:陈明

出版社:中国铁道出版社

出版时间:2019-01-01

ISBN:9787113248185

定价:¥52.00

购买这本书可以去
内容简介
  大数据技术是一个面向实际应用的技术。从大数据中获取有价值信息是大数据技术的精髓。《大数据技术概论》概括性介绍了数据科学与大数据技术的主要内容。全书分为9章,主要包括概述、大数据处理平台、大数据获取与存储管理技术、大数据抽取技术、大数据清洗技术、大数据去噪与标准化、大数据约简与集成技术、大数据分析与挖掘技术、大数据分析结果解释与展现。《大数据技术概论》在内容上,注重基本概念、基本方法介绍,实例丰富、语言精练、逻辑层次清晰,适合作为大学“数据科学与大数据技术”专业和相近专业的教材,也可以作为科技人员的参考书。
作者简介
  陈明,国内计算机科学领域资深专家,曾任大连理工大学计算机科学与工程系教授、系主任,中国石油大学(北京)计算机科学与技术系教授、系主任。中国计算机学会理事、中国人工智能学会理事、中国人工智能学会智能信息网专委会副主任。全国高校计算机基础教育研究会常务理事、教育部IT&AT 教育工程专家组成员。
目录
第1章 概述
1.1 数据科学
1.1.1 数据科学的产生与发展
1.1.2 数据科学的相关术语
1.1.3 数据科学的主要内容
1.1.4 数据科学的研究过程与体系框架
1.1.5 数据科学、数据技术与数据工程
1.1.6 大数据问题
1.2 大数据的生态环境
1.2.1 互联网世界
1.2.2 物理世界
1.3 大数据的概念
1.3.1 数据容量
1.3.2 数据类型
1.3.3 价值密度
1.3.4 速度
1.3.5 真实性
1.4 大数据的性质
1.4.1 非结构性
1.4.2 不完备性
1.4.3 时效性
1.4.4 安全性
1.4.5 可靠性
1.5 大数据处理周期
1.5.1 大数据处理全过程
1.5.2 大数据技术的特征
1.5.3 大数据的一些热点技术
1.6 科学研究范式
1.6.1 科学研究范式的产生与发展
1.6.2 数据密集型科学研究第四范式
小结
第2章 大数据处理平台
2.1 Hadoop大数据处理平台
2.1.1 离线计算概述
2.1.2 MapReduce分布编程模型
2.1.3 基于Hadoop的分布计算
2.1.4 MapReduce程序设计分析
2.1.5 Hadoop环境部署与程序运行
2.2 Storm大数据处理平台
2.2.1 流式数据的概念与特征
2.2.2 大数据的计算模式
2.2.3 流式数据处理技术的应用
2.2.4 流式计算的系统架构
2.2.5 Stoxm流处理过程
2.2.6 单词计数topology
2.3 Spark大数据处理平台
2.3.1 交互式处理系统的问题
2.3.2 Scala编程语言简介
2.3.3 Spark的主要特点
……
第3章 大数据获取与存储管理技术
第4章 大数据抽取技术
第5章 大数据清洗技术
第6章 大数据去躁与标准化
第7章 大数据约间与集成技术
第8章 大数据分析与挖掘技术
第9章 大数据分析结果解释与展现
参考文献
猜您喜欢

读书导航