数据库
-
蓝鲸法则洪磊大数据目前被广泛联系到现代商业社会的各个场景。众多的研究文献都会聚集于从技术层面来挖掘这些数据、处理这些数据、到最后分析这些数据,然而,由于目前对大数据分析处理的主要认知是:⑴相关性比因果性重要;⑵要全量而不要抽样;⑶要宏观而不要精确,而使得通过这种方式获得的大数据结论往往过于宏观肤浅,对具体行业应用而言并没有实际的指导意义。如此往往陷阱于:盲大、夸大、自大,大数据分析技术总是和业务场景脱节,使得大数据分析的真正价值失之交臂。大数据的真正价值便在于,通过分析才能获取很多智能的、深入的、有价值的洞察来解决行业面临的问题。数据处理和分析能力,最有效的获得大数据能力方式便是“化大为小、化繁为简”大小数据结合,通过“简约法则”(“数·信·知·洞察")来实现来获得大数据价值:数据认识及处理:通过将大数据进行去噪、分类、整合得出小数据;信息求证及获取:对小数据进行求证、交换,将数据转为新信息;知识孕育:对新信息赋予场景的去分析、去整理、去提炼之后,来发现新知、新规律和新价值体系;洞察获取:获得需要通过有应用场景为基础的数据解读来完成,这种建构新规律、新知识和新价值体的结论观点便是我们洞悉的洞察。 -
基础、设计与实现David本书从基础、设计和实现三个层面介绍数据库处理技术,内容全面翔实,既包括数据库设计、数据库实现、多用户数据处理、数据访问标准等经典理论,也包括商务智能、XML和.NET等最新技术。本书在内容编排和写作风格上新颖,强调学习过程中的乐趣,围绕两个贯穿全书的项目练习,让读者从一开始就能把所学的知识用于解决具体的应用实例。 -
实时分析拜伦·埃利斯本书共11章。第1章介绍常见的流数据的来源、应用以及三个重要特性:持续交付、结构松散和高基数,并阐释对流数据使用基础架构和算法的重要性。第2~6章介绍实时流架构的各组件涉及的软件、框架和方法。第2章概述实时流架构设计涉及的组件、特性、编程语言等。第3章介绍实时流架构的服务配置和协调,重点介绍协调服务器ZooKeeper。第4章阐述实时流架构中数据流程的管理,涉及用来管理数据流程的两个软件包Kafka和Flume。第5章分析流数据的处理,涉及如何用Storm或Samza来处理数据。第6章介绍流数据的存储问题。第7~11章重点关注流数据架构的应用构建问题。第7章讨论从流环境向最终用户的数据交付问题。这是构建仪表板以及其他监控应用所使用的核心机制。第8章涵盖流环境下的聚集计算问题,特别是对多分辨率时间序列数据的聚集计算问题。第9章简要介绍统计学和概率论的基础知识。第10章讨论略图,略图通常具有更快的更新速度和更小的内存占用空间,特别适合流环境。第11章讨论聚集计算之外能够应用于流数据的一些更深入的话题。 -
SAP HANA平台应用开发刘刚本书在逻辑上可分为五个部分:第一部分:包含第1章和第2章,该部分主要是讲解SAPHANA服务器的各个组件,原生项目的开发架构,以及通过SAPHANA工作台快速了解系统的一些操作。第二部分:包含第3章和第4章,这部分以信息建模、SQLScript为主,这部分内容相对独立,而且早于XS应用出现在HANA系统中,但因后续的XS项目示例中会应用这两个章中所学习的知识,所以本书加入了该部分。第三部分:包含第5~8章,这部分包含了HANA原生应用开发绝大部分内容,包含XS项目的创建、核心数据服务、访问控制、XSJS、OData和UI5的集成等。第四部分:包含第9~11章,这部分内容是用一个例子来说明,涉及HANAXS原生应用的开发过程及所涉及的全部对象。第五部分:包含第12章和第13章及附录。这部分内容讲解HANA应用上线后如何进行运维、团队如何进行协同开发,以及如何实现系统的高可用。在附录部分,提供了作者的很多经验和心得。 -
Oracle数据库系统管理实例教程沈翠新暂缺简介... -
R语言数据挖掘方法及应用薛薇大数据不仅意味着数据的积累、存储与管理,更意味着大数据的分析。数据挖掘无可争议地成为当今大数据分析的核心利器。R语言因彻底的开放性策略业已跻身数据挖掘工具之首列。本书以“R语言数据挖掘入门并不难”为开篇,总览了数据挖掘的理论和应用轮廓,明确了R语言入门的必备知识和学习路线,并展示了数据挖掘的初步成果,旨在使读者快速起步数据挖掘实践。后续围绕数据挖掘应用的四大核心方面,安排了数据预测篇:立足数据预测未知,数据分组篇:发现数据中的自然群组,数据关联篇:发现数据的内在关联性,离群数据探索篇:发现数据中的离群点。每篇下各设若干章节,各章节从简单易懂且具代表性的案例问题入手,剖析理论方法原理,讲解R语言实现,并给出案例的R语言数据挖掘代码和结果解释。本书内容覆盖之广泛,原理讲解之通俗,R语言实现步骤之详尽,在国内外同类书籍中尚不多见。相关数据资料及电子教案,可登录华信教育资源网www.hxedu.com.cn免费下载。 -
Neo4j实战阿列克萨·武科蒂奇本书以实例为依托,详细地对实例做建模分析,并给出经过测试的源代码,读者可以按照书的介绍一步一步地实现每一个实例,这是一种学习建模和编程的极为便捷的方法。本书也是一本对使用Neo4j对图形数据进行设计、建模和查询的综合指导书。书中探索了处理和查询图形数据的各种工具及其强大功能,包括图形遍历的概念及其使用方法,也讨论了Neo4j的图形查询语言Cypher和如何使用SpringDataNeo4j将Neo4j集成到应用程序中,以及如何使用服务器模式和嵌入式模式等内容。 -
大数据是这样计算的杨旭随着大数据分析方法的发展,分析工具的改进,大数据分析的门槛降低了。基于大数据算法平台,数据分析师们已经不再被数据的“大”所困扰,可以轻松地探索大数据,挖掘大数据的价值。本书侧重介绍大数据分析方法和算法的应用,适合对大数据分析感兴趣的读者阅读。在内容的组织上,选取了10个不同领域的真实数据集,针对每个数据的特点,选择适合的方法和算法,和读者一起体验数据探索、数据分析、建模预测的过程;通过实例计算的结果,读者会更加了解各种方法和算法的长处和局限。本书的实例都运行在大数据算法平台XLab上。 -
数据科学家修炼之道Zacharias数据科学家是指采用科学方法、运用数据挖掘工具寻找新的数据洞察的工程师,他们往往集技术专家和数据分析师的角色于一身。在IT行业中,数据科学家将在创造力、沟通能力以及与商业世界的联系方面得到更多的锻炼机会,是当前非常有发展潜力的新兴职位。本书全面介绍了成为数据科学家应当了解的各类知识。全书共分18章,首先介绍了数据科学与大数据、数据科学的重要性,接着介绍了数据科学家的类型、思维体系、技术资质、经验、社交圈、所用的软件、学习新知和解决问题,另外还介绍了机器学习与R语言平台、数据科学的处理流程、所需的具体技能,介绍了数据科学求职、自我展示并提供了一些有关职业数据科学家和数据科学家的案例学习。本书内容全面、轻松易读,非常适合从事数据科学相关工作的读者阅读,是一本可以住读者应聘数据科学家职位的求职指南。 -
大数据赵刚大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、基本概念,从业务的角度分析了大数据应用的主要业务价值和业务需求,在此基础上介绍大数据的技术架构和关键技术,结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。最后,对大数据面临的挑战和未来的趋势进行了展望。第2版,对于这几年的发展做一个补充。
