家庭与办公软件
-
个人数据管理李玉坤 孟小峰 著本书基于作者多年在个人数据管理方面的研究积累,对个人数据管理相关技术进行了总结和整理,内容涵盖了个人数据管理技术的发展、数据模型、数据集成、数据融合、数据存储、数据查询、系统实现、个人数据管理新技术发展几个部分。 -
移动数据挖掘连德富,张富峥,王英子,袁晶,谢幸 著本书根据作者近年来在移动数据挖掘方向的研究成果和工作进行编写,在主题上和当前学术界和工业界的热点相一致,自成体系,内容丰富,介绍了移动数据挖掘的基本概念和方法,包括移动数据预处理、用户移动模型、用户画像以及兴趣位置推荐等等。 -
大数据集成董欣 著;王秋月 译本书作者在多年研究传统数据集成的基础上,着重分析了大数据背景下的大数据集成。和传统的数据集成相比,大数据集成具有一些新的挑战,例如数据和数据源的海量性、数据的多样性和数据的动态性等。本书共分6章,包括大数据集成的挑战和机遇、模式对齐、记录链接、数据融合、出现的新问题和结论,系统地讨论了解决大数据集成中关键问题的一些重要研究成果和方法,对大数据集成的研究者和实践者都很有帮助。另外本书也可以作为学生学习该领域的入门读物。 -
大数据分析王伟军 著王伟军、刘蕤、周光有编*的《大数据分析》结合大数据分析实操和商务应用场景,以大数据分析流程为主线,按照“原理、方法、工具和应用”组织内容体系,主要内容包括:大数据生态系统和大数据分析的环境搭建、大数据收集、大数据计算、大数据挖掘、大数据可视化,通过在用户搜索行为分析和个性化推荐系统两个现实场景中的实验,阐述并展示了大数据分析的环境配置和大数据分析的应用实例。 本书以附录形式呈现大数据分析实验环境搭建、Hadoop组件参数配置,以及大数据分析相关学习资源。此外,我们还制作了配套PPT课件、案例、习题、试卷及答案等电子资源,以及实验所用完整数据,方便读者动手实践书中所讲解的实例。 本书适合于电子商务、信息管理与信息系统及相关专业的大学生和研究生学习,以及对大数据分析感兴趣和有志于从事数据分析工作的读者阅读使用。 -
Spark[美] Ilya,Ganelin(伊利亚-甘列林) 等 著;李刚 译本书针对spark从验证性环境迁移到实际生产环境时会遇到的各种问题给出了实际的帮助,涵盖了开发及维护生产级Spark应用的各种方法、组件与有用实践。全书分为6章,第1 ~ 2章帮助读者深入理解Spark的内部机制以及它们在生产流程中的含义;第3章和第5章阐述了针对配置参数的法则和权衡方案,用来调优Spark,改善性能,获得高可用性和容错性;第4章专门讨论Spark应用中的安全问题;第6章则全面介绍生产流,以及把一个应用迁移到一个生产工作流中时所需要的各种组件,同时对Spark生态系统进行了梳理。 -
云计算通俗讲义王良明 著本书力求简明扼要地阐述云计算的基本概念,让非IT专业人士也能轻松看懂这一现在人人都能接触(以后程度会更深)的事物――云计算。本书遵循一条由感性到理性、由浅入深的主线展开:首先采用情景描述,让外行的人对云计算也能产生感性认识;其次从计算机的基本知识开始逐步引出云计算的概念,使人产生理性认识;接着列举一系列生活中的典型云应用例子,让人们明白云计算给生活带来的确切好处;最后采用三个云计算实施方案让人们感受一下组建云计算中心的过程,以达到抛砖引玉之功效。本书可作为高等院校学生教材。 -
从1到π蓝云 著本书以国家促进大数据发展行动纲要为指导,上篇探讨了何为大数据以及大数据在治理现代化过程中的运用,建构起理论框架;下篇以地方政府及各行业的具体实践为案例分析,并介绍了多位专家学者的观点。 书中包含丰富案例与专家访谈实录,理论与实践指导兼具,提供了数据研究及应用的新成果,是国内首部专注数据治理、立足广东经验的图书。 -
Spark大数据分析[美] 穆罕默德·古勒 著;赵斌 马景 陈冠诚 译本书是关于大数据和Spark的一个简明手册。它将助你学习如何用Spark来完成很多大数据分析任务,其中覆盖了高效利用Spark所需要知道的重要主题:如何使用SparkShell进行交互式数据分析、如何编写Spark应用、如何在Spark中对大规模数据进行交互分析、如何使用SparkStreaming处理高速数据流、如何使用Spark进行机器学习、如何使用Spark进行图处理、如何使用集群管理员部署Spark、如何监控Spark应用等。本书还对其他配合Spark一起使用的大数据技术进行了介绍,包括HDFS、Avro、Parquet、Kafka、Cassandra、HBase、Mesos等。本书也对机器学习和图的概念进行了介绍。 -
大数据架构和算法实现之路黄申 著全书介绍了一些主流些技术在商业项目中的应用,包括:机器学习中的分类、聚类和线性回归,搜索引擎,推荐系统,用户行为跟踪,架构设计的基本理念以及常用的消息和缓存机制。在这个过程中,我们有机会实践R、Mahout、Solr、Elasticsearch,Hadoop、HBase、Hive、Flume、Kafka,Storm等系统。和前作不同之处在于,本书完全是面向技术人员,因此提供了大量详尽的实现步骤和代码分析。不过,本书在技术和商业结合方面,仍然和前作保持一致,从具体业务需求出发演变到合理的技术方案和实现,根据不同的应用场景、不同的数据集合、不同的进阶难度,我们为读者提供了反复温习和加深印象的机会。 -
企业大数据系统构建实战吕兆星,郑传峰,宋天龙,杨晓鹏 著对于很多企业而言,大数据的重要性不言而喻,但是如何构建、实施和应用大数据系统却是一个复杂工程。本书让读者认识到大数据不仅仅是数据、技术、架构、应用,更是结合了商业模式、战略定位、信息安全、单位协同、组织保障、实施选型的完整体系。 本书内容从大数据的规划定位、组织实施和价值提升三个维度展开,兼顾从整体性、全局性、安全性、价值性、技术性、体系性等方面的考虑。 第一部分:企业大数据战略规划 主要从宏观的角度介绍大数据的定位、组织保障、解决方案选择和自主实施思路,目的是从全局角度引导建立大数据工作的整体思维。 第二部分:企业大数据落地实施 主要从执行层面介绍了大数据落地相关的技术、架构、开发、大数据工作流、应用和价值评估,直接以落地视角解读大数据工作中每个环节涉及到的流程、知识和方法,这也是本书的核心章节。 第三部分:大数据价值、变革和挑战 主要涉及大数据的社会价值、当前问题和挑战以及大数据的未来趋势,这是对现有大数据工作的延展以及未来趋势的探索。
