数据库挖掘/数据仓库
-
管理海量数据(美)Ian H.Witten ,(美)Alistair Moffat,(美)Timothy C.Bell 著,梁斌,杨青 译《管理海量数据:压缩、索引和查询(第2版)(经典再现全新修订版)》是斯坦福大学信息检索和挖掘课程的首选教材之一,并已成为全球主要大学信息检索的主要教材。《管理海量数据:压缩、索引和查询(第2版)》理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面。其最大的特色在于不仅仅满足信息检索理论学习的需要,更重要的是给出了实践中可能面对的各种问题及其解决方法。《管理海量数据:压缩、索引和查询(第2版)(经典再现全新修订版)》作为斯坦福大学信息检索课程的教材之一,具有一定的阅读难度,主要面向信息检索专业高年级本科生和研究生、搜索引擎业界的专业技术人员和从事海量数据处理相关专业的技术人员。
-
数据挖掘的应用与实践李涛 等著国际数据挖掘领域知名专家李涛及其带领团队近年研究成果的总结,以实际的数据挖掘工作为基石,架设起研究和应用的桥梁,帮助读者们从应用实例中学习数据外挖掘。《数据挖掘的应用与实践:大数据时代的案例分析》不按理论和技术来划分章节,而是以实际的应用案例来贯穿始终,通过数据挖掘应用的实例来介绍如何应用和学习数据挖掘技术。
-
云时代的大数据周品 著《云时代的大数据》以云计算为基石,从概念、研究、应用角度出发,系统地介绍了数据爆炸时代下的大数据。首先介绍了云计算及大数据的基础知识,让读者对云计算及大数据有概要认识;然后根据需要介绍了Hadoop软件下的MapReduce、HDFS及HBase这几个组件;接着全面、系统地介绍了云时代下的大数据,主要包括大数据的链接、聚类、项集、系统、相似项挖掘及数据量化等内容,让读者挖掘云时代大数据体系下的效益、价值及研究方向。
-
大数据分析(美)Frank J. Ohlhorst 著,王伟军 ,刘凯 ,杨光 译 Jenny Sun 校《大数据分析:点“数”成金》以大数据分析的商业及金融价值为主线,对大数据这一崭新领域进行了深入探索。《大数据分析:点“数”成金》以大数据技术的基本概念和演进历程开篇,随后详细介绍了不同类型的数据源及其对企业的重要意义、企业投资大数据技术的成功商业案例、有效利用数据集的必备技能,解析了打造大数据分析系统所需的存储、加工、软件平台及其他构成要素,海量数据的安全工具和技术,系统潜在风险及其规避方法,以及怎样对大数据进行分析并从中提取有价值的可用信息,并详实阐述了如何将大数据融入企业文化等问题。《大数据分析:点“数”成金》不但向读者阐明了大数据分析的重要性,更淋漓尽致地展现了大数据分析的具体过程,从而帮助企业提升智能化水平、解决实际问题、提升利润空间、提高生产率并发现更多的商业机会。《大数据分析:点“数”成金》适合对数据处理、数据挖掘、数据分析感兴趣的企业决策者、技术人员等阅读。
-
网站数据分析张洪举 著网站分析领域的开创性著作,首度将六西格玛质量管理工具和思想引入网站分析中,将网站分析的复杂过程统一了起来,使分析的思维和方法更科学化和系统化,这是质量管理思想和数据分析技术的伟大结合。与此同时,《网站数据分析:数据驱动的网站管理、优化和运营》将网站分析必备的各项方法和技术,充分融入到了整个体系中,包含大量案例和最佳实践,真正做到了用数据来驱动网站的管理、优化和运营。《网站数据分析:数据驱动的网站管理、优化和运营》一共分为五个部分:第一部分(第1~2章),简要介绍了网站分析和六西格玛质量管理的主要内容,以及Excel软件的主要功能和进行数据分析所应掌握的基本知识;第二部分(第3章)是六西格玛改进模型的定义阶段,讲解了如何识别和描述问题、理清问题边界、收集客户需求和确定客户需求的关键质量特性等;第三部分(第4~8章)是六西格玛改进模型的测量阶段,讲解了流程测量的起点、网站常用度量指标,以及Excel基本数据处理技巧和数据透视表、SQL查询等高级处理技巧;第四部分(第9~11章)是六西格玛改进模型的分析阶段,介绍了流程分析、逻辑树分析、杜邦分析、劣质成本分析、统计图表分析等多种分析方法,以及如何在数据分析的基础上查找问题的根本原因;第五部分(第12~13章)是六西格玛改进模型的改进和控制阶段,介绍了如何确定改进方案和确保各项改进措施能够得到有效执行。
-
大数据时代的历史机遇赵国栋、易欢欢、糜万军、鄂维南 著大数据正以前所未有的速度,颠覆人们探索世界的方法、驱动产业间的融合与分立。《大数据时代的历史机遇:产业变革与数据科学》力图系统、全面的阐述大数据在社会、经济、科学研究等方方面面的影响,或许可以帮助大家澄清一些认知误区,有助于大数据在各行各业落地生根。全书分为三大部分,第一部分重点讲述大数据时代产业发展的三大趋势以及驱动产业融合、升级、转型的根本因素,并给出践行大数据的最佳范式。第二部分首次完整 阐述“数据科学”的基础性价值,论述数据科学对科学研究、社会研究、产业发展的影响,并提出数据科学的教育体系。第三部分全景式的介绍重点国家、经济体、 新兴企业在大数据领域取得的进展,展示一幅真实的大数据图景,把判断留给读者,看谁拥有未来!大数据是“在多样的或者大量的数据中快速获取信息的能力”。大数据是一种思维方式,必须融入到企业的每一个毛细血管中。大数据时代已经到来,正在引发一场革命!大数据正以前所未有的速度颠覆人们探索世界的方法,引起社会、经济、学术、科研、国防、军事等领域的深刻变革。数据成为资产、产业垂直整合、泛互联网化是大数据时代的三大发展趋势。数据资产成为和土地、资本、人力并驾齐驱的关键生产要素。围绕数据资产可以演绎跌宕起伏的产业大戏。数据科学应运而生并将逐渐达到与自然科学分庭抗礼的地位。数据科学既可以推动数学、计算机科学、统计学、天体信息学、生物信息学、计算社会学等学科的发展,又能够助力产业界升级转型。
-
数据可视化实战Scott Murray 译者 李松峰你手头有一些数据,想做成漂亮的图表放到网站上?好主意,通过浏览器来跨平台实现数据可视化是正确的选择。什么,你还想让图表能够响应用户操作?没问题,交互式图表比静态图片更能吸引人去探究本源。好啦,要生成通过浏览器展示的动态图表,首选目前最热门的Web数据可视化库——D3。《数据可视化实战:使用D3设计交互式图表》这本书很有意思,而且对读者要求不高。不需要知道什么是数据可视化,也不用有太多Web开发背景就能看懂它。不信?翻一翻就知道这是一本既好玩又实用的动手指南啦!看完这本书你会怎么样呢?掌握必要的HTML、CSS、JavaScript和SVG基础知识;学会基于数据在网页里生成元素和为它们设置样式的技巧;能够生成条形图、散点图、饼图、堆叠条形图和力导向图;使用平滑的过渡动画来展示数据的变化;赋予图表动态交互能力,响应用户从不同角度探索数据的请求;收集数据和创建自定义的地图;另外,《数据可视化实战:使用D3设计交互式图表》100多个代码示例都可以在线浏览!
-
数据可视化的基本原理与方法陈为,张嵩,鲁爱东《普通高等教育“十二五”规划教材:数据可视化的基本原理与方法》是面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,专门为计算机、数据处理、视觉设计、统计、数学、航空航天、建筑、遥感影像等专业本科生开设数据可视化课程而编写的一本教材。全书划分为三篇:基础篇、数据篇和应用篇。其中,基础篇从人、数据、可视化流程等三个层面阐述数据可视化的基础理论和概念;数据篇则针对实际应用中遇到的不同类型的数据,包括时空数据、地理信息数据、高维非空间数据、层次和网络数据介绍相应的可视化方法;应用篇着重介绍可视化综合应用及实用系统。为了便于学习,每章后都附有习题和参考文献。《普通高等教育“十二五”规划教材:数据可视化的基本原理与方法》的特点是内容完整,叙述简明,重点突出;以数据类型为导向,以行业应用为目标。作者专门收集和整理了相关的课程教案、典型数据、精彩案例、可视化作品、课程附属视频和动画材料。《普通高等教育“十二五”规划教材:数据可视化的基本原理与方法》可作为高等院校计算机、数据处理及相关专业高年级学生和研究生的教学用书,对于从事数据可视化、数据分析、视觉艺术开发和应用的科技人员也有较大的参考价值。
-
大数据的冲击(日)城田真琴 著《大数据的冲击》是日本最畅销的大数据商业应用指南。书中结合野村综合研究独家披露的调查数据,网罗了美国、日本标杆企业与政府的应用案例,总结了大数据的商业模式,以及在大数据应用中需要注意的隐私问题,并就如何为大数据时代做好准备展开了深入的探讨,提出了诸多有益的建议。《大数据的冲击》适合商业人士以及与大数据相关的IT 从业者阅读。
-
数据挖掘与数据化运营实战卢辉《数据挖掘与数据化运营实战:思路、方法、技巧与应用》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,全方位整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。《数据挖掘与数据化运营实战:思路、方法、技巧与应用》共19章,分为三个部分:基础篇(第1~4章)系统介绍了数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的核心,以及实践中常见分析项目类型;实战篇(第6~13章)主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示;思想意识篇(第5章,第14~19章)主要是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。