书籍详情

大数据背后的核心技术

大数据背后的核心技术

作者:张桂刚 著

出版社:电子工业出版社

出版时间:2017-01-01

ISBN:9787121302961

定价:¥65.00

购买这本书可以去
内容简介
  本书分为三大部分,分别为大数据基础理论分析、基于海量语意规则的大数据流处理技术及大数据应用。 第一部分介绍大数据领域的主要基础理论,包括大数据基本概念、可编程数据中心、云文件系统、云数据库系统、大数据并行编程与分析模型、大数据智能计算算法、基于大数据的数据仓库技术、大数据安全与隐私保护,以及基于大数据的语意软件工程方法等。 第二部分介绍基于海量语意规则的大数据流处理技术,包括基于规则的大数据流处理介绍、语意规则描述模型、海量语意规则网及优化、海量语意规则处理算法及海量语意规则并行处理等。 第三部分主要介绍大数据的一些典型应用,包括:文化大数据、医疗健康大数据、互联网金融大数据、教育大数据、电子商务大数据、互联网大数据、能源大数据、交通大数据、宏观经济大数据、进出口食品安全监管大数据、基于大数据的语意计算及典型应用(含语意搜索引擎、语意金融、语意旅游规划、基于海量语意规则的语意电子商务)。最后探讨了大数据未来的研究方向。
作者简介
  张桂刚:清华大学博士后,美国加州大学尔湾分校访问学者,现为中国科学院自动化研究所副研究员,研究生导师。国家公共文化服务体系建设专家委员会委员,中国人工智能学会智能服务专业委员会委员,IEEE/ACM/中国自动化学会会员,中国计算机学会高级会员。BigMM/ICSC/ICRC(多媒体大数据/语义计算/机器人计算)三个国际会议的Workshop联合主席。主持或参与973、863、国家科技支撑计划、工信部民机专项、国家自然基金等课题10余个,发表SCI/EI论文40余篇,申请发明专利20余项。主要研究方向:大数据、语意(义)计算、大飞机综合健康管理、图计算。李超:博士,副研究员,清华大学息技术研究院WEB 与软件技术研究中心副主任,兼任金融大数据/智慧健康大数据两联合研究中心副主任,中国计算机学会信息存储技术专委委员,中国高等学校计算机教育研究会对外联络委员会委员,全国文影标(SAC/TC86/SC6)委员、全国信标委教育技术分技术委员会(TC28/SC36)委员、ISO/IEC JTC1 SC36 WG8 Learning Analytics Interoperability工作组专家。发表论文50余篇、已授权专利10余项。在海量数据存储、组织与管理、分析,及其在教育/医疗/金融等领域的应用方面有十余年经验。邢春晓:清华大学信息技术研究院博导,副院长。主要研究领域包括:数据库和数据仓库,数据工程和知识工程,软件工程,面向智慧城市的教育、医疗、金融和政务的大数据关键技术研究等。发表学术论文180多篇,其中SCI 20多篇、EI 100多篇,发明专利20余项。
目录
目 录
第一部分 大数据基础理论分析\t(1)
第1章 大数据基本概念\t(2)
1.1 大数据定义\t(2)
1.2 大数据度量\t(3)
1.2.1 大数据能耗度量\t(3)
1.2.2 大数据计算能力度量\t(4)
1.2.3 大数据的数据中心服务能力度量\t(4)
1.2.4 大数据商业与社会价值度量\t(4)
1.2.5 大数据冷热度度量\t(5)
1.3 语意计算的发展过程\t(5)
1.3.1 语义计算(Semantic Computing)\t(5)
1.3.2 语意计算(Semantic+ Computing)\t(5)
1.3.3 语意计算(Semantic++ Computing)\t(6)
1.3.4 语意计算和大数据\t(7)
1.4 大数据的语意理解\t(8)
1.4.1 大数据资源语意存储\t(9)
1.4.2 大数据资源语意信息获取\t(9)
1.4.3 语意资源管理\t(9)
1.4.4 大数据语意处理\t(10)
1.4.5 大数据语意服务(语意分析/语意合成等)\t(10)
1.4.6 大数据语意安全与隐私\t(10)
1.4.7 语意接口\t(10)
1.4.8 基于语意的大数据应用\t(10)
1.5 大数据和云计算\t(11)
1.5.1 云计算\t(11)
1.5.2 大数据和云计算的关系\t(11)
本章小结\t(12)
第2章 可编程数据中心\t(13)
2.1 可编程数据中心体系架构\t(13)
2.2 数据分配管理\t(14)
2.2.1 数据分配管理原理\t(14)
2.2.2 数据分配管理案例\t(17)
2.3 异构数据节点分配管理\t(19)
2.3.1 异构数据节点分配管理方法\t(20)
2.3.2 异构数据节点服务能力计算方法\t(22)
2.4 规则管理\t(23)
2.4.1 规则\t(23)
2.4.2 语意规则\t(24)
2.4.3 海量语意规则管理架构\t(24)
2.5 数据放置策略\t(25)
2.5.1 谷歌的数据放置策略\t(25)
2.5.2 Hadoop的数据放置策略\t(26)
2.5.3 其他常用的数据放置策略\t(26)
2.5.4 语意数据放置策略\t(26)
2.6 可编程数据中心机房架构\t(30)
本章小结\t(30)
第3章 云文件系统\t(32)
3.1 常用云文件系统综述\t(32)
3.2 语意云文件系统SCFS\t(34)
3.2.1 SCFS系统架构\t(34)
3.2.2 SCFS大小文件处理机制\t(36)
3.2.3 数据一致性保障\t(40)
3.2.4 元数据集群管理技术\t(40)
3.2.5 副本管理策略(负载均衡机制)\t(41)
本章小结\t(44)
第4章 云数据库系统\t(45)
4.1 常用云数据库系统综述\t(45)
4.2 语意云数据库系统SCloudDB\t(47)
4.2.1 SCloudDB系统架构\t(47)
4.2.2 SCloudDB设计思路\t(48)
4.2.3 SCloudDB的SRegion定位机制\t(50)
4.2.4 多维及海量随机查询机制\t(51)
4.2.5 支持多维及海量随机查询的语意搜索机制\t(52)
4.2.6 大表划分方法\t(54)
4.2.7 基于列族存储及语意的大表划分机制\t(56)
4.2.8 分布式同步关键技术\t(57)
本章小结\t(59)
第5章 大数据并行编程与分析模型\t(60)
5.1 大数据并行编程与分析模型综述\t(60)
5.2 大数据并行编程与分析模型SemanMR\t(63)
5.2.1 SemanMR体系架构\t(63)
5.2.2 SemanMR技术思路\t(64)
5.3 SemanMR关键技术\t(66)
5.3.1 基于语意的调度器关键技术\t(66)
5.3.2 SemanMR的作业/任务状态交互新规则\t(68)
5.3.3 语意映射器关键技术\t(69)
5.3.4 基于语意的作业调度器关键技术\t(70)
5.3.5 基于语意的任务调度器关键技术\t(73)
5.3.6 任务跟踪器关键技术\t(76)
5.4 SemanMR计算部分框架\t(78)
5.5 SemanMR原理分析\t(82)
5.5.1 SemanMR原理实现分析\t(82)
5.5.2 SemanMR实现原理特点分析\t(84)
5.6 基于SemanMR的大数据实时处理与分析实现技术\t(88)
5.6.1 SemanMR实时架构\t(88)
5.6.2 SemanMR的MapReduce网络优化技术\t(89)
本章小结\t(94)
第6章 大数据智能计算算法\t(95)
6.1 大数据智能计算算法架构\t(95)
6.2 数据采集算法\t(95)
6.2.1 管理信息系统数据采集\t(96)
6.2.2 网络信息数据采集\t(96)
6.2.3 物理信息数据采集\t(96)
6.3 数据预处理算法\t(97)
6.4 数据挖掘算法\t(99)
6.4.1 分类算法\t(99)
6.4.2 聚类算法\t(100)
6.4.3 关联挖掘算法\t(101)
6.4.4 推荐算法\t(101)
6.5 复杂智能算法\t(103)
6.5.1 大数据溯源算法\t(103)
6.5.2 大数据的相关推荐算法\t(105)
6.5.3 基于大数据的决策管理算法\t(105)
6.5.4 基于模型的推理及预测算法\t(106)
6.5.5 基于数据的推理及预测算法\t(107)
6.5.6 基于规则的推理及预测算法\t(109)
6.5.7 混合推理及预测算法\t(109)
本章小结\t(109)
第7章 基于大数据的数据仓库技术\t(110)
7.1 Facebook中Hive采用的技术思路与存在问题分析\t(110)
7.1.1 Hive采用的技术思路分析\t(110)
7.1.2 Hive存在的问题分析\t(111)
7.2 Yahoo!中Pig采用的技术思路与存在问题分析\t(111)
7.2.1 Pig采用的技术思路分析\t(111)
7.2.2 Pig存在的问题分析\t(112)
7.3 未来数据仓库架构需求分析\t(113)
7.4 一种基于大数据的数据仓库SemanDW\t(114)
本章小结\t(114)
第8章 大数据安全与隐私保护\t(115)
8.1 大数据安全模型BigData-PKI\t(115)
8.1.1 大数据安全体系结构\t(115)
8.1.2 大数据安全模型BigData-PKI\t(116)
8.2 大数据安全协议BigData-Protocol\t(118)
8.3 大数据隐私\t(120)
8.4 大数据的隐私提取方法\t(121)
8.4.1 大数据的直接隐私提取方法\t(121)
8.4.2 大数据的间接隐私提取方法\t(121)
8.5 大数据隐私保护模型BigData-Privacy\t(122)
8.6 大数据共享信息与隐私信息融合技术\t(122)
8.6.1 大数据的共享信息与隐私信息融合机制\t(123)
8.6.2 大数据的共享信息与隐私信息融合算法\t(123)
8.6.3 大数据的共享信息与隐私信息融合质量评价模型\t(123)
8.7 云环境下医疗大数据安全和隐私保护示范\t(125)
8.7.1 云环境下大数据安全和隐私保护架构\t(125)
8.7.2 数据分割及安全机制\t(127)
8.7.3 数据融合及安全机制\t(129)
8.7.4 基于隐私数据的查询机制\t(130)
8.7.5 数据完整性保障机制\t(131)
8.8 海量电子病历安全保护应用\t(133)
本章小结\t(134)
第9章 基于大数据的语意软件工程方法\t(135)
9.1 基于大数据的语意软件工程体系架构\t(136)
9.2 基于大数据的语意软件编制\t(136)
9.2.1 基于大数据的语意软件编制方法\t(136)
9.2.2 基于大数据的语意软件编制方法设计思路\t(137)
9.2.3 复杂的SemanPL程序编程实现原理分析\t(138)
9.2.4 基于大数据的语意编程语言SemanPL\t(139)
9.2.5 SemanPL编译器原理分析\t(141)
9.3 基于大数据的语意软件测试\t(143)
9.4 基于大数据的语意软件验证\t(143)
9.5 基于大数据的语意软件工程方法的语意软件系统应用\t(144)
本章小结\t(144)
第二部分 基于海量语意规则的大数据流处理技术\t(145)
第10章 基于规则的大数据流处理介绍\t(147)
10.1 基于规则的大数据流\t(147)
10.1.1 基于规则的大数据流应用背景\t(147)
10.1.2 基于规则的大数据流应用意义\t(148)
10.2 大数据流的规则处理技术国内外研究现状\t(149)
10.3 存在的问题总结与分析\t(153)
本章小结\t(154)
第11章 语意规则描述模型\t(155)
11.1 规则表示方法\t(155)
11.2 规则节点图形化符号表示模型\t(155)
11.2.1 非计算规则节点\t(156)
11.2.2 计算规则节点\t(156)
11.3 规则粒度\t(158)
11.4 规则节点流量分析\t(159)
11.5 计算规则节点计算代价分析\t(163)
本章小结\t(167)
第12章 海量语意规则网及优化\t(168)
12.1 海量语意规则网概述\t(168)
12.2 海量语意规则网维护\t(169)
12.2.1 海量语意规则网增量集成\t(169)
12.2.2 删除规则节点时的规则网维护\t(170)
12.3 海量语意规则网优化方法\t(171)
12.3.1 基于规则合并的优化方法\t(171)
12.3.2 规则模块等价变换的优化方法\t(173)
本章小结\t(183)
第13章 海量语意规则处理算法\t(184)
13.1 传统规则处理算法存在的问题\t(184)
13.2 海量语意规则模式匹配模型\t(185)
13.2.1 海量语意规则模式匹配模型体系结构\t(185)
13.2.2 概念与介绍\t(186)
13.2.3 模式网络存储组织\t(186)
13.2.4 海量语意规则模式匹配算法\t(188)
13.3 海量语意规则模式匹配算法特点\t(192)
13.4 海量语意规则网运行处理机制\t(195)
本章小结\t(198)
第14章 海量语意规则并行处理\t(199)
14.1 海量语意规则并行处理面临的问题\t(199)
14.2 海量语意规则并行处理机制\t(200)
14.2.1 海量语意规则并行处理机制GAPCM概述\t(200)
14.2.2 海量语意规则子网生成\t(201)
14.2.3 海量语意规则网计算代价预分配\t(202)
14.2.4 海量语意规则网通信\t(219)
14.2.5 映射分配\t(220)
本章小结\t(221)
第三部分 大数据应用\t(223)
第15章 文化大数据\t(224)
15.1 文化大数据的意义\t(224)
15.2 文化大数据关键技术平台架构\t(225)
15.3 文化大数据资源层\t(226)
15.4 文化大数据综合平台层\t(227)
15.5 基于文化大数据的应用\t(228)
15.6 文化大数据云管理系统\t(232)
本章小结\t(234)
第16章 医疗健康大数据\t(235)
16.1 医疗健康大数据\t(235)
16.2 医疗健康大数据平台架构\t(235)
16.3 医疗健康大数据共享平台\t(237)
16.3.1 集中式医疗健康大数据共享平台\t(237)
16.3.2 分散式医疗健康大数据共享平台\t(238)
16.4 医疗健康大数据分散式架构资源集成方法\t(239)
16.5 医疗健康大数据数据安全保护机制\t(241)
16.6 医疗健康大数据隐私保护机制\t(241)
16.7 医疗健康大数据挖掘与分析\t(242)
16.8 基于可穿戴设备的居家医疗养老大数据分析系统\t(243)
16.9 医疗健康大数据其他典型应用\t(244)
本章小结\t(245)
第17章 互联网金融大数据\t(246)
17.1 互联网金融\t(246)
17.1.1 互联网金融的概念\t(246)
17.1.2 互联网金融的产生\t(246)
17.1.3 互联网金融分类\t(247)
17.1.4 互联网金融发展历程\t(248)
17.1.5 互联网金融发展阶段\t(251)
17.1.6 互联网金融发展趋势\t(252)
17.2 大数据金融\t(253)
17.3 金融大数据架构\t(254)
17.3.1 金融大数据数据源\t(255)
17.3.2 数据采集/清洗/转换\t(255)
17.3.3 金融大数据存储\t(255)
17.3.4 各种金融模型\t(256)
17.3.5 各种大数据挖掘分析算法\t(257)
17.3.6 各种大数据并行编程模型\t(257)
17.3.7 各种大数据金融应用\t(257)
17.4 大数据金融案例\t(257)
本章小结\t(258)
第18章 其他典型大数据\t(259)
18.1 教育大数据\t(259)
18.1.1 教育大数据平台架构\t(259)
18.1.2 基于大数据的教育社区学生/教师个性化服务\t(261)
18.1.3 基于大数据的教育社区学生行为建模与分析\t(262)
18.1.4 基于大数据的教育社区教学规律分析\t(262)
18.1.5 基于大数据的教育社区个性化教学\t(262)
18.1.6 基于教育大数据的语意问答系统\t(262)
18.2 电子商务大数据\t(263)
18.2.1 电子商务大数据平台架构\t(263)
18.2.2 电子商务虚假图片监测\t(265)
18.2.3 电子商务产品个性化推荐\t(265)
18.2.4 基于电子商务大数据的消费者行为分析\t(266)
18.2.5 基于电子商务大数据的物流\t(266)
18.2.6 电子商务实时大数据流规则处理\t(266)
18.2.7 电子商务评估管理系统\t(267)
18.3 互联网大数据\t(267)
18.3.1 互联网大数据平台架构\t(267)
18.3.2 互联网热点计算\t(268)
18.3.3 互联网热点个性化推荐\t(268)
18.3.4 互联网舆情监测\t(268)
18.3.5 互联网热点趋势分析预测\t(269)
18.3.6 互联网舆情预警应用\t(269)
18.3.7 大型网络软件平台的数据采集与分析方案\t(269)
18.4 能源大数据\t(272)
18.4.1 石油大数据\t(272)
18.4.2 智能电网大数据\t(275)
18.5 交通大数据\t(276)
18.6 宏观经济大数据\t(278)
18.7 进出口食品安全监管大数据\t(280)
18.7.1 基于大数据的进出口食品安全监管系统总体架构\t(280)
18.7.2 基于大数据的进出口食品安全监测分析\t(280)
18.7.3 基于海量语意规则的进出口食品社会应急分析\t(281)
18.7.4 基于大数据的进出口食品溯源分析\t(282)
18.7.5 基于大数据的进出口食品安全决策\t(283)
本章小结\t(283)
第19章 基于大数据的语意计算及典型应用\t(284)
19.1 基于大数据的应用领域分析\t(284)
19.1.1 基于大数据的社交网络领域应用分析\t(284)
19.1.2 基于大数据的医疗领域应用分析\t(285)
19.1.3 基于大数据的政府领域应用分析\t(287)
19.1.4 基于大数据的金融领域应用分析\t(289)
19.1.5 基于大数据的企业计算应用分析\t(290)
19.2 语意搜索引擎\t(291)
19.2.1 传统搜索引擎\t(292)
19.2.2 语义搜索引擎(Semantic Search Engine)\t(293)
19.2.3 语意搜索引擎(Semantic+ Search Engine)\t(293)
19.2.4 语意搜索引擎(Semantic++ Search Engine)\t(295)
19.3 语意金融\t(296)
19.4 语意旅游\t(296)
19.5 语意电子商务\t(297)
19.5.1 案例概述\t(297)
19.5.2 校园社区网规则举例\t(298)
19.5.3 优化的带流量的规则网\t(302)
19.5.4 未经优化的带流量的规则网优化\t(302)
19.5.5 规则网络代价计算\t(305)
19.5.6 规则网络任务划分\t(306)
19.5.7 规则子网划分\t(308)
本章小结\t(310)
第20章 大数据未来研究方向\t(311)
参考文献\t(316)
猜您喜欢

读书导航