数据库挖掘/数据仓库
-
大数据技术与应用中国产业发展研究院本书是围绕我国国民经济和社会发展第十四个五年规划和2035 年远景目标等重大要求, 由中国通信学会、中国产业发展研究院联合组织编写的“新基建核心技术与融合应用丛书” 之一。大数据技术的战略意义不在于掌握庞大的数据信息, 而在于对这些含有意义的数据进行专业化处理。换而言之, 如果把大数据比作一种产业, 那么这种产业实现盈利的关键在于提高对数据的“加工能力”, 通过“加工” 实现数据的“增值”。本书立足数字经济浪潮, 以促进数据合规高效流通使用、赋能实体经济为主线, 重点围绕大数据采集、流通、安全、治理及应用等全生命周期进行编写, 覆盖大数据存储、计算、管理、安全与治理、资产管理与流通、分析、平台、产业与应用等环节, 对培育新质生产力, 推动我国数字经济高质量发展具有重要参考价值。本书适合IT、金融、研究机构相关从业人员以及高等院校相关专业的学生使用, 也可供对大数据感兴趣的读者阅读。 -
社交网络信息传播模型、算法及应用朱建明本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。 -
海洋大数据分析预报技术石绥祥等本书从大数据和人工智能的角度,系统、全面介绍海洋预测预报与挖掘分析技术。全书分为三个部分:第一部分(第1~3章)是数据部分,对海洋大数据的特征、资源分析、处理评估、平台架构、存储管理、分析处理等进行阐述;第二部分(第4~5章)是方法部分,介绍基于机器学习的海洋大数据典型挖掘分析方法,包括回归方法、聚类方法、关联方法、分类方法及可视分析方法,并给出典型的深度学习预测方法;第三部分(第6~10章)是应用部分,展示利用海洋大数据处理方法对各类海洋数据进行分析预报的成果,包括对海表温度、海面高度、海洋三维温盐、台风路径和赤潮发生概率的分析预报。 -
大数据开发实战猿媛之家本书深入探讨了大数据技术的核心概念和实际应用。从大数据的基础架构Hadoop开始,逐步解析了分布式协调服务Zookeeper、数据仓库Hive、面向列的数据库HBase等关键技术。此外,还介绍了数据迁移工具Sqoop、数据采集工具Flume、发布订阅消息系统Kafka等实用工具。本书还深入讲解了数据处理分析引擎Spark、全文搜索引擎Elasticsearch及分布式处理引擎Flink的工作原理和应用实例。最后,通过电商推荐系统实战和Flink实现电商用户行为分析两个案例,展示了大数据技术在实际业务中的应用。本书附带全书实例源代码、电子版本教程(下载方式见封底),以及可扫码观看的长达13个小时的部分实例操作视频,帮助读者更深入了解大数据技术的具体内容,非常适合对大数据技术感兴趣的读者,尤其是想要深入了解大数据技术原理和应用的开发者和管理者阅读。 -
产业数字化国家工业信息安全发展研究中心 清华大学数据治理研究中心洞见产业新生态,解码数字新经济行业场景真实展示 实际案例深度梳理,感受数字转型路径风格谭建荣院士、郭华东院士、邬贺铨院士、张宏科院士 共同推荐《产业数字化——释义、场景及应用案例》以《“十四五”数字经济发展规划》中产业数字化部分的核心内容为纲领,从入选工业和信息化部的大数据产业发展示范项目中,选取了具有产业代表性的来自生产一线的数字化转型实践案例,连同数字化建设和转型的共性基础内容,组织了42 个案例,从实践背景、方法手段、主要应用的技术、实践过程中遇到的典型问题、实施流程、典型应用场景等方面,分享了多个行业、多家单位的实践经验,以期帮助读者对产业数字化转型产生更为具体的了解和体会、获得间接经验,为读者提升数字认知和工作能力做一定的基础铺垫。本书适合具有产业数字化转型需求的相关企业的管理者、运维人员阅读参考,也适合相关院校作为大数据、数据运维相关专业的产教融合教材使用。 -
循序渐进Spark大数据应用开发柳伟卫《循序渐进Spark大数据应用开发》结合作者一线开发实践,循序渐进地介绍了新版Apache Spark 3.x的开发技术。全书共10章,第1章和第2章主要介绍Spark的基本概念、安装,并演示如何编写最简单的Spark程序。第3章深入探讨了Spark的核心组件RDD。第4章讲解了Spark集群管理,帮助读者理解任务提交与执行的基本原理。第5章介绍了Spark SQL,这是处理结构化数据的基础工具。第6章展示了Spark Web UI,通过界面化的方式了解Spark集群运行状况。第7章和第8章分别介绍了Spark流式数据处理框架Spark Streaming和Structured Streaming。第9章和第10章则分别介绍了业界流行的机器学习和图计算处理框架MLlib和GraphX。书中各章节还提供了丰富的实战案例和上机练习题,以便读者在学习的同时进行实际操作,迅速提升动手能力。《循序渐进Spark大数据应用开发》技术先进,案例丰富,适合对Spark大数据应用感兴趣的学生、大数据开发人员及架构师使用,也可作为培训机构和高校大数据课程的教学用书。 -
数据挖掘竞赛实战许可乐本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案进行深入分析,并提供方案对应的实现代码。本书适合数据挖掘竞赛爱好者、人工智能相关专业在校大学生、人工智能方向从业人员及对人工智能感兴趣的读者阅读。 -
一本书讲透首席数据官王晓华 赵瑞这是一本能指导首席数据官(CDO)快速构建知识体系和能力模型的标准指南。本书融合了作者对CDO角色的深刻理解和深厚的工程实践经验,系统而全面地介绍了CDO所需的核心知识体系与能力模型。本书从CDO的基本概念出发,逐步深入探讨了CDO在政策环境、数字化转型、组织数据体系建设与管理、数据价值创造等方面的关键作用。书中不仅详细阐述了CDO应具备的基础数据知识和组织数据管理能力,还通过丰富的案例和实战技巧,展示了如何将理论知识应用于实际业务场景中,推动数据驱动决策的实现。通过阅读本书,你将:?透彻理解CDO的角色定位、职责范围及发展趋势;?掌握组织数据管理的精髓,构建高效的数据体系;?深入了解CDO在数字化转型中的核心作用与价值;?实战演练数据战略制定、数据资源管理、数据资产管理与流通等关键任务;?探索CDO的能力模型与知识体系,规划个人职业发展道路。本书旨在帮助读者从零基础开始,逐步成长为具备深厚数据功底和卓越领导能力的首席数据官,为企业的数据战略转型与升级提供有力支持。 -
数据挖掘算法实践与案例详解丁兆云 沈大勇 徐伟 周鋆数据挖掘算法为大数据与人工智能的核心,掌握数据挖掘各算法的编程实现,有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现,同时,本书以多个经典的数据挖掘赛题为案例,详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现,有助于提升读者面对实际数据问题时灵活运用各类算法能力。 -
大规模数据管理[荷]皮特因·施特伦霍尔特(Piethein Strengholt) 著,戴伟 译本书的主要内容有:研究数据管理趋势,包括技术发展、法规要求和隐私问题。深?了解可拓展架构,学习各组件之间如何协同?作。探索数据治理和数据安全、主数据管理、?助式数据市场,以及元数据的重要性。
