书籍详情
驾驭大数据
作者:(美)Bill Franks 著 黄海,车皓阳,王悦 等 译
出版社:人民邮电出版社
出版时间:2013-01-01
ISBN:9787115304803
定价:¥49.00
购买这本书可以去
内容简介
《驾驭大数据》为读者提供了处理大数据和在你的企业中培养一种创新和发现的文化所需的工具、过程和方法,描绘了一个易于实施的行动计划,以帮助你的企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。本书主要介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。《驾驭大数据》适于所有对数据、数据挖掘、数据分析感兴趣的技术人员和决策者阅读。
作者简介
BillFranks是Teradata公司全球合作伙伴计划的首席分析专家,他负责跟踪研究分析领域的前端趋势,帮助客户理解Teradata和其分析合作伙伴如何为客户创造价值。Bill还负责管理Teradata与SAS合作成立的业务分析创新中心,并专注于帮助客户获得创新分析能力。此外,Bill负责制定Teradata公司在高级分析领域的战略与定位。 Bill是国际数据分析研究所的一名讲师,国际数据分析研究所(International Institute forAnalytics)是由分析领域专家Tom Davenport成立的研究机构。Bill还是一名活跃的演讲人和博客作者,他的博客地址是:http://iianalytics.com/category/faculty-blogs/bill-franks。 Bill一直专注于如何将复杂的分析转化为业务人员可以理解的语言,并帮助企业更有效地使用这些分析成果。他曾服务于很多不同行业和公司规模的客户,其中有财富前100强的大型企业,也有小型的非营利组织。 Bill拥有弗吉尼亚科技大学应用统计专业的学士学位,以及北卡罗来纳州立大学应用统计专业的硕士学位。
目录
第一部分 大数据的兴起
第1章 什么是大数据,大数据为什么重要
1.1 什么是大数据
1.2 大数据中的“大”和“数据”哪个更重要
1.3 大数据有何不同
1.4 大数据为何是数量更多的、相同类型的传统数据
1.5 大数据的风险
1.6 你为什么需要驾驭大数据
1.7 大数据的结构
1.8 探索大数据
1.9 很多大数据其实并不重要
1.10 有效过滤大数据
1.11 将大数据和传统数据混合
1.12 对大数据标准的需求
1.13 今天的大数据将不再是明天的大数据
1.14 本章小结
第2章 网络数据:原始的大数据
2.1 网络数据概观
2.1.1 你遗漏了什么
2.1.2 想象各种可能性
2.1.3 一个全新的信息来源
2.1.4 应当收集什么数据
2.1.5 关于隐私
2.2 网络数据揭示了什么
2.2.1 购物行为
2.2.2 顾客的购买路径和偏好
2.2.3 研究行为
2.2.4 反馈行为
2.3 行动中的网络数据
2.3.1 最优的推荐商品
2.3.2 流失模型
2.3.3 响应模型
2.3.4 顾客分类
2.3.5 评估广告效果
2.4 本章小结
第3章 典型大数据源及其价值
3.1 汽车保险业:车载信息服务数据的价值
3.2 多个行业:文本数据的价值
3.3 多个行业:时间数据与位置数据的价值
3.4 零售制造业:RFID数据的价值
3.5 电力行业:智能电网数据的价值
3.6 博彩业:筹码跟踪数据的价值
3.7 工业发动机和设备:传感器数据的价值
3.8 视频游戏:遥测数据的价值
3.9 电信业与其他行业:社交网络数据的价值
3.10 本章小结
第二部分 驾驭大数据:技术、过程以及方法
第4章 分析可扩展性的演进
4.1 分析可扩展性的历史
4.2 分析与数据环境的关联性
4.3 海量并行处理系统
4.3.1 使用MPP系统进行数据准备与评分
4.3.2 使用MPP系统进行数据准备与评分小结
4.4 云计算
4.4.1 公有云
4.4.2 私有云
4.4.3 云计算小结
4.5 网格计算
4.6 MapReduce
4.6.1 MapReduce工作原理
4.6.2 MapReduce优缺点
4.6.3 MapReduce小结
4.7 这不是一个单选题
4.8 本章小结
第5章 分析流程的演进
5.1 分析沙箱
5.1.1 分析沙箱:定义与范围
5.1.2 分析沙箱的好处
5.1.3 内部分析沙箱
5.1.4 外部分析沙箱
5.1.5 混合式分析沙箱
5.1.6 不要仅仅使用数据,而要丰富数据
5.1.7 系统负载管理和容量规划
5.2 什么是分析数据集
5.2.1 两种分析数据集
5.2.2 传统的分析数据集
5.3 企业分析数据集
5.3.1 什么时候创建企业分析数据集
5.3.2 企业分析数据集里有什么
5.3.3 逻辑结构与物理结构
5.3.4 更新企业分析数据集
5.3.5 汇总表还是概要视图
5.3.6 分享财富
5.4 嵌入式评分
5.4.1 嵌入式评分集成
5.4.2 模型与评分管理
5.5 本章小结
第6章 分析工具与方法的演进
6.1 分析方法的演进
6.1.1 组合建模
6.1.2 简易模型
6.1.3 文本分析
6.1.4 跟上分析方法的发展脚步
6.2 分析工具的演进
6.2.1 图形化用户界面的崛起
6.2.2 单点解决方案的兴起
6.2.3 开源的历史
6.2.4 数据可视化的历史
6.3 本章小结
第三部分 驾驭大数据:人和方法
第7章 如何提供优质分析
7.1 分析与报表
7.1.1 报表
7.1.2 分析
7.2 分析的G.R.E.A.T原则
7.2.1 导向性(Guided)
7.2.2 相关性(Relevant)
7.2.3 可解释性(Explainable)
7.2.4 可行性(Actionable)
7.2.5 及时性(Timely)
7.3 核心分析方法与高级分析方法
7.4 坚持你的分析
7.5 正确地分析问题
7.6 统计显著性与业务重要程度
7.6.1 统计显著性
7.6.2 业务重要程度
7.7 样本VS全体
7.8 业务推断与统计计算
7.9 本章小结
第8章 如何成为优秀的分析专家
8.1 哪些人是分析专家
8.2 对分析专家常见的误解
8.3 每一位优秀的分析专家都是独特的
8.3.1 教育
8.3.2 行业经验
8.3.3 当心“人力资源清单”
8.4 优秀分析专家身上经常被低估的特质
8.4.1 承诺
8.4.2 创造力
8.4.3 商业头脑
8.4.4 演讲能力与沟通技巧
8.4.5 直觉
8.5 分析认证有意义吗,还是干扰视听的噪音
8.6 本章小结
第9章 如何打造优秀的分析团队
9.1 各个行业并非生而平等
9.2 行动起来
9.3 人才紧缩
9.4 团队组织结构
9.4.1 分布式组织结构
9.4.2 集中式组织结构
9.4.3 混合式组织结构
9.5 持续更新团队技能
9.5.1 矩阵式方法
9.5.2 管理人员不能眼高手低
9.6 应该由谁来做高级分析工作
9.6.1 前后矛盾的地方
9.6.2 如何帮助刚刚从事分析工作的新手茁壮成长
9.7 IT人员和分析专家为何相处不好
9.8 本章小结
第四部分 整合:分析文化
第10章 促进分析创新
10.1 商业需要更多创新
10.2 传统的方法阻碍了创新
10.3 定义分析创新
10.4 在创新分析中使用迭代方法
10.5 考虑换个角度
10.6 你是否为建立分析创新中心做好了准备
10.6.1 组件1:技术平台
10.6.2 组件2:第三方的产品和服务
10.6.3 组件3:承诺和支持
10.6.4 组件4:强大的团队
10.6.5 组件5:创新委员会
10.6.6 分析创新中心的指导原则
10.6.7 分析创新中心的工作范围
10.6.8 处理失败
10.7 本章小结
第11章 营造创新和探索的文化氛围
11.1 做好准备
11.1.1 Crocs和Jibbitz的传说
11.1.2 推动创新
11.2 关键原则概述
11.2.1 原则1:打破思维定势
11.2.2 原则2:形成连锁反应
11.2.3 原则3:统一行动目标
11.3 本章小结
结论:再敢想一些
第1章 什么是大数据,大数据为什么重要
1.1 什么是大数据
1.2 大数据中的“大”和“数据”哪个更重要
1.3 大数据有何不同
1.4 大数据为何是数量更多的、相同类型的传统数据
1.5 大数据的风险
1.6 你为什么需要驾驭大数据
1.7 大数据的结构
1.8 探索大数据
1.9 很多大数据其实并不重要
1.10 有效过滤大数据
1.11 将大数据和传统数据混合
1.12 对大数据标准的需求
1.13 今天的大数据将不再是明天的大数据
1.14 本章小结
第2章 网络数据:原始的大数据
2.1 网络数据概观
2.1.1 你遗漏了什么
2.1.2 想象各种可能性
2.1.3 一个全新的信息来源
2.1.4 应当收集什么数据
2.1.5 关于隐私
2.2 网络数据揭示了什么
2.2.1 购物行为
2.2.2 顾客的购买路径和偏好
2.2.3 研究行为
2.2.4 反馈行为
2.3 行动中的网络数据
2.3.1 最优的推荐商品
2.3.2 流失模型
2.3.3 响应模型
2.3.4 顾客分类
2.3.5 评估广告效果
2.4 本章小结
第3章 典型大数据源及其价值
3.1 汽车保险业:车载信息服务数据的价值
3.2 多个行业:文本数据的价值
3.3 多个行业:时间数据与位置数据的价值
3.4 零售制造业:RFID数据的价值
3.5 电力行业:智能电网数据的价值
3.6 博彩业:筹码跟踪数据的价值
3.7 工业发动机和设备:传感器数据的价值
3.8 视频游戏:遥测数据的价值
3.9 电信业与其他行业:社交网络数据的价值
3.10 本章小结
第二部分 驾驭大数据:技术、过程以及方法
第4章 分析可扩展性的演进
4.1 分析可扩展性的历史
4.2 分析与数据环境的关联性
4.3 海量并行处理系统
4.3.1 使用MPP系统进行数据准备与评分
4.3.2 使用MPP系统进行数据准备与评分小结
4.4 云计算
4.4.1 公有云
4.4.2 私有云
4.4.3 云计算小结
4.5 网格计算
4.6 MapReduce
4.6.1 MapReduce工作原理
4.6.2 MapReduce优缺点
4.6.3 MapReduce小结
4.7 这不是一个单选题
4.8 本章小结
第5章 分析流程的演进
5.1 分析沙箱
5.1.1 分析沙箱:定义与范围
5.1.2 分析沙箱的好处
5.1.3 内部分析沙箱
5.1.4 外部分析沙箱
5.1.5 混合式分析沙箱
5.1.6 不要仅仅使用数据,而要丰富数据
5.1.7 系统负载管理和容量规划
5.2 什么是分析数据集
5.2.1 两种分析数据集
5.2.2 传统的分析数据集
5.3 企业分析数据集
5.3.1 什么时候创建企业分析数据集
5.3.2 企业分析数据集里有什么
5.3.3 逻辑结构与物理结构
5.3.4 更新企业分析数据集
5.3.5 汇总表还是概要视图
5.3.6 分享财富
5.4 嵌入式评分
5.4.1 嵌入式评分集成
5.4.2 模型与评分管理
5.5 本章小结
第6章 分析工具与方法的演进
6.1 分析方法的演进
6.1.1 组合建模
6.1.2 简易模型
6.1.3 文本分析
6.1.4 跟上分析方法的发展脚步
6.2 分析工具的演进
6.2.1 图形化用户界面的崛起
6.2.2 单点解决方案的兴起
6.2.3 开源的历史
6.2.4 数据可视化的历史
6.3 本章小结
第三部分 驾驭大数据:人和方法
第7章 如何提供优质分析
7.1 分析与报表
7.1.1 报表
7.1.2 分析
7.2 分析的G.R.E.A.T原则
7.2.1 导向性(Guided)
7.2.2 相关性(Relevant)
7.2.3 可解释性(Explainable)
7.2.4 可行性(Actionable)
7.2.5 及时性(Timely)
7.3 核心分析方法与高级分析方法
7.4 坚持你的分析
7.5 正确地分析问题
7.6 统计显著性与业务重要程度
7.6.1 统计显著性
7.6.2 业务重要程度
7.7 样本VS全体
7.8 业务推断与统计计算
7.9 本章小结
第8章 如何成为优秀的分析专家
8.1 哪些人是分析专家
8.2 对分析专家常见的误解
8.3 每一位优秀的分析专家都是独特的
8.3.1 教育
8.3.2 行业经验
8.3.3 当心“人力资源清单”
8.4 优秀分析专家身上经常被低估的特质
8.4.1 承诺
8.4.2 创造力
8.4.3 商业头脑
8.4.4 演讲能力与沟通技巧
8.4.5 直觉
8.5 分析认证有意义吗,还是干扰视听的噪音
8.6 本章小结
第9章 如何打造优秀的分析团队
9.1 各个行业并非生而平等
9.2 行动起来
9.3 人才紧缩
9.4 团队组织结构
9.4.1 分布式组织结构
9.4.2 集中式组织结构
9.4.3 混合式组织结构
9.5 持续更新团队技能
9.5.1 矩阵式方法
9.5.2 管理人员不能眼高手低
9.6 应该由谁来做高级分析工作
9.6.1 前后矛盾的地方
9.6.2 如何帮助刚刚从事分析工作的新手茁壮成长
9.7 IT人员和分析专家为何相处不好
9.8 本章小结
第四部分 整合:分析文化
第10章 促进分析创新
10.1 商业需要更多创新
10.2 传统的方法阻碍了创新
10.3 定义分析创新
10.4 在创新分析中使用迭代方法
10.5 考虑换个角度
10.6 你是否为建立分析创新中心做好了准备
10.6.1 组件1:技术平台
10.6.2 组件2:第三方的产品和服务
10.6.3 组件3:承诺和支持
10.6.4 组件4:强大的团队
10.6.5 组件5:创新委员会
10.6.6 分析创新中心的指导原则
10.6.7 分析创新中心的工作范围
10.6.8 处理失败
10.7 本章小结
第11章 营造创新和探索的文化氛围
11.1 做好准备
11.1.1 Crocs和Jibbitz的传说
11.1.2 推动创新
11.2 关键原则概述
11.2.1 原则1:打破思维定势
11.2.2 原则2:形成连锁反应
11.2.3 原则3:统一行动目标
11.3 本章小结
结论:再敢想一些
猜您喜欢