书籍详情
大数据导论
作者:张尧学,胡春明,中国电子学会 著
出版社:机械工业出版社
出版时间:2018-09-01
ISBN:9787111607670
定价:¥49.80
购买这本书可以去
内容简介
本书是中国科协新一代信息技术系列丛书之一。 本书重点阐述大数据的基本原理;技术;平台和不同领域的应用案例。全书共分13 章,第1 章为绪论;第2 ~ 7 章为技术章节,介绍了数据采集与治理;数据管理;数据分析;数据可视化;数据安全与隐私保护和大数据处理平台;第8 ~11 章为大数据在不同领域的应用案例,包括社会网络大数据;城市大数据;工业大数据和教育大数据;第12;13 章为数据管理章节,包括数据开放与共享和大数据的法律政策规范。 本书主要面向大学非计算机类的工科专业的高年级学生与研究生,亦可作为大数据爱好者的科普读物。 本书配有免费的电子课件,欢迎选用本书作教材的老师登录www.cmpedu.com 注册下载。
作者简介
大数据导论; 编写组顾问:李德毅 中国工程院院士梅 宏 中国科学院院士王海峰 百度高级副总裁主编:张尧学 中国工程院院士执行主编:胡春明 北京航空航天大学参编:王宏志 哈尔滨工业大学唐 杰 清华大学王建民 清华大学袁晓如 北京大学朱跃生 北京大学吴中海 北京大学吕金虎 北京航空航天大学王 晨 清华大学陈恩红 中国科学技术大学刘 闯 中国科学院王德庆 北京航空航天大学马民虎 西安交通大学
目录
目录
前 言
基 础 篇
第1 章 绪论 3
1.1 概述 3
1.1.1 数据 4
1.1.2 数据中蕴含的价值 6
1.1.3 获取数据中蕴含的价值 8
1.2 大数据的内涵和外延 9
1.2.1 大数据时代的驱动力 9
1.2.2 大数据的概念和特征 10
1.2.3 大数据带来的思维模式改变 12
1.2.4 大数据的作用和意义 13
1.3 大数据的技术挑战和科学意义 15
1.3.1 数据处理的一般过程 16
1.3.2 大数据计算面临的挑战 17
1.3.3 大数据计算的特点 18
1.3.4 大数据计算平台 19
1.3.5 大数据与云计算;人工智能的关系 20
1.4 数据科学 22
1.4.1 数据科学的提出 23
1.4.2 数据科学的范畴 23
1.4.3 数据科学对学科发展的影响 24
习题 25
参考文献及扩展阅读资料 26
技 术 篇
第2 章 数据采集与治理 29
2.1 概述 30
2.2 大数据的来源与多源数据的采集方式 30
2.2.1 大数据的来源 30
2.2.2 多源数据的采集 31
2.2.3 数据离散化 33
2.3 数据集成和跨界应用的数据集成方法 34
2.3.1 数据集成的定义与形式 34
2.3.2 传统数据集成 35
2.3.3 跨界数据集成 38
2.4 数据的预处理 40
2.4.1 数据变换 40
2.4.2 数据质量的检验与提升 41
习题 44
参考文献及扩展阅读资料 44
第3 章 数据管理 46
3.1 概述 46
3.2 关系数据库 47
3.2.1 关系数据模型 48
3.2.2 结构化查询语言 51
3.2.3 数据库事务 52
3.2.4 关系数据库管理系统 53
3.3 分布式文件系统 54
3.3.1 Hadoop 55
3.3.2 Ceph 57
3.3.3 GlusterFS 59
3.3.4 分布式文件系统对比 60
3.4 新型数据管理与查询系统 61
3.4.1 NoSQL 数据库 61
3.4.2 SQL on Hadoop 系统 65
......
前 言
基 础 篇
第1 章 绪论 3
1.1 概述 3
1.1.1 数据 4
1.1.2 数据中蕴含的价值 6
1.1.3 获取数据中蕴含的价值 8
1.2 大数据的内涵和外延 9
1.2.1 大数据时代的驱动力 9
1.2.2 大数据的概念和特征 10
1.2.3 大数据带来的思维模式改变 12
1.2.4 大数据的作用和意义 13
1.3 大数据的技术挑战和科学意义 15
1.3.1 数据处理的一般过程 16
1.3.2 大数据计算面临的挑战 17
1.3.3 大数据计算的特点 18
1.3.4 大数据计算平台 19
1.3.5 大数据与云计算;人工智能的关系 20
1.4 数据科学 22
1.4.1 数据科学的提出 23
1.4.2 数据科学的范畴 23
1.4.3 数据科学对学科发展的影响 24
习题 25
参考文献及扩展阅读资料 26
技 术 篇
第2 章 数据采集与治理 29
2.1 概述 30
2.2 大数据的来源与多源数据的采集方式 30
2.2.1 大数据的来源 30
2.2.2 多源数据的采集 31
2.2.3 数据离散化 33
2.3 数据集成和跨界应用的数据集成方法 34
2.3.1 数据集成的定义与形式 34
2.3.2 传统数据集成 35
2.3.3 跨界数据集成 38
2.4 数据的预处理 40
2.4.1 数据变换 40
2.4.2 数据质量的检验与提升 41
习题 44
参考文献及扩展阅读资料 44
第3 章 数据管理 46
3.1 概述 46
3.2 关系数据库 47
3.2.1 关系数据模型 48
3.2.2 结构化查询语言 51
3.2.3 数据库事务 52
3.2.4 关系数据库管理系统 53
3.3 分布式文件系统 54
3.3.1 Hadoop 55
3.3.2 Ceph 57
3.3.3 GlusterFS 59
3.3.4 分布式文件系统对比 60
3.4 新型数据管理与查询系统 61
3.4.1 NoSQL 数据库 61
3.4.2 SQL on Hadoop 系统 65
......
猜您喜欢