数据库
-
多粒度大数据分析方法徐计,王国胤,李天瑞,邓伟辉在大数据时代,数据的获取、传输和存储融入了人类生产生活的方方面面,而大数据核心价值体现为人们对数据的分析、理解与应用。面对如此海量、高速和异构的数据,仅靠人类的认知和理解能力远不能满足价值发现的需要。同时,计算机总是针对最细粒度数据进行迭代优化的求解模式在特定场景下也不能满足数据分析的时限需求。粒计算作为一种模拟人类知识表示和问题求解的近似数据分析范式,其优点在于解决问题时能够选择合适粒度,达到求解精度和计算时效的**平衡。所以,粒计算通常能够以更高的效率获得“有效解”。本书以引领树和云模型作为数据多粒度表示的基本方法,系统地展示了引领树和云模型在大数据多粒度聚类、数据流即时聚类、半监督学习和时间序列预测等大数据分析场景中的理论研究成果及应用案例。 -
企业数字化转型最小可行之道褚幼鸿如今,数字化转型已经上升为国家战略,并且也成为企业发展的必经之路。本书以流程数字化和自动化为起点,通过流程自动化达到软件设计自动化,让所有的企业成为“软件企业”:通过敏捷的业务架构设计和应用系统交付,应对千变万化的外在业务环境,解决企业 IT 系统开发“慢、贵、难”的问题,实现业务和 IT 的一体化,让业务人员和 IT人员一起面对客户,提供优质的客户体验和具有独特价值主张的数字化产品包,提升产品包的竞争力,满足客户现在和未来的需求。本书内容主要包括企业数字化转型概述、企业数字化顶层设计方法论、企业数字化架构、企业数字化业务设计、企业数字化转型路线图、企业流程自动化、企业软件设计自动化。另外,本书还介绍了华为和星展银行数字化转型的案例。本书最大的特色是融合了数字化转型理论、工具和实战,为意欲进行数字化转型的企业提出了一条“最小”“可行”之道。 -
复杂数据质量控制技术曹建军 郑奇斌 刘艺 翁年凤复杂性是大数据区别于小数据的本质特性,也是当前大数据质量控制与数据治理面临的核心挑战。本书围绕大数据的复杂性开展研究,旨在探索当前数据资源建设与利用过程中面临的挑战和技术难题,促进数据价值的充分释放。全书分为6部分,共24章。第1部分概述(第1、2章),综述所研究数据控制技术的基本概念和任务定位,以及国内外的研究进展; 第2部分实体分辨技术(第3~13章),研究了高维数据实体分辨、名称分辨、XML数据实体分辨和跨模态数据实体分辨等; 第3部分真值发现技术(第14~18章),研究了单真值发现、多真值发现、文本数据真值发现,以及基于多蚁群优化和基于深度神经网络的真值发现等; 第4部分基于数据依赖的数据质量控制技术(第19~21章),研究了数据录入辅助预测与推理方法、不一致数据检测与修复方法,以及有限先验知识下的全局数据质量评估; 第5部分系统与平台(第22、23章),介绍了数据质量控制系统,以及数据治理平台的设计与实现; 第6部分结束语(第24章),归纳总结了当前面临的风险和挑战。本书务实求新,系统性强,易读性和可操作性好,既可作为数据质量控制与数据治理领域的进阶用书,又可作为数据资源建设与利用、信息技术等相关学科领域的教学参考或工程实践指导用书。 -
Spark分布式处理实战刘均 王璐烽暂缺简介... -
像程序员一样使用MySQL黄文毅熟练使用MySQL数据库,是研发工程师和数据库工程师的bi备技能之一。本书从程序员的视角介绍了MySQL数据库在实际开发中的核心知识和应用技能。全书共14章。第1章主要讲解MySQL数据库以及客户端工具的安装;第2~4章主要介绍数据库与表的创建、数据类型与表达式,以及函数、运算符与变量;第5章主要讲解select查询语句、子查询以及连接查询;第6章主要讲解索引和索引类型;第7、8章主要介绍MySQL事务的ACID特性、事务的四种隔离级别、如何使用事务、存储过程和视图概述,以及如何使用存储过程和视图;第9章介绍MySQL用户权限管理以及数据备份与恢复;第10章介绍如何设计数据库,包括关联关系、E-R实体关系模型;第11~13章主要介绍MySQL日志、锁以及分库分表;第14章介绍SQL性能优化与字符集。附录部分包含本书用到的SQL脚本、词汇解释以及高频面试题。本书适合所有计算机专业的学生、软件开发人员,以及DBA使用,也可作为培训机构MySQL教学的参考书。 -
零基础学MySQL数据库管理林富荣本书是一本全面介绍数据库管理的书籍。基础介绍篇介绍了数据库、SQL、MySQL 以及 数据类型等概念,并介绍了 MySQL 的安装和查询;实践入门篇详细介绍了数据库的创建、查询、 插入、修改和删除等语句的使用方法;中高级篇深入介绍了 MySQL 关键字、运算操作、日期 函数、视图、操作符等,同时介绍了如何对数据库文件进行备份和恢复;应用实战篇以核酸数 据库系统为例,介绍业务流程、系统流程、分布式系统、Redis、核酸数据库系统的设计与实现、 搜索引擎,以及使用 PHP 程序调用数据库等内容。 本书内容新颖、图文并茂、实例丰富、通俗易懂,可供互联网开发人员、数据库运营人 员以及培训机构等相关人员阅读,亦可作为初学者的入门教材。 -
鲲鹏云大数据服务与基础应用田广强 李井竹 主编\"本书系统介绍大数据基本原理、框架、方法和应用技术,部分章节着重介绍鲲鹏大数据生态。全书共9章,分别介绍大数据技术概况,Hadoop与鲲鹏大数据架构及其相关组件,分布式协调系统Zookeeper、非关系型数据库HBase、数据仓库Hive等应用技术,大数据框架Spark的原理、机构及其生态圈,数据采集系统Flume和Kafka框架的设计、工作原理及应用场景,鲲鹏BigData pro综合案例,鲲鹏社区的发展情况、开发案例、产品和解决方案、鲲鹏生态的情况。本书可以作为鲲鹏产业学院专业核心课程的教材,帮助学生了解大数据发展过程与基本知识,熟悉大数据框架的基本原理与发展现状,培养大数据平台设计、分析应用能力。本教材也可作为普通本科院校大数据、计算机等计算机类专业课程的选修课材料,以及作为高职高专计算机类专业的专业课程教材。\" -
以城市智慧生活服务体系支撑无障碍便捷生活叶依谦,高渝斐本书先在系统性地梳理 外智慧城市的发展现状以及指标评价体系的基础上,提炼智慧城市大框架下和无障碍便捷生活服务相关的子系统,探索各领域的智慧服务应用。同时,基于多方面的调研,梳理出面向北京2022年冬残奥会的智慧生活服务需求,归纳整合后提出面向冬残奥会的智慧生活服务体系框架。建立科学合理的面向冬残奥会的智慧生活服务体系框架,不仅可以为北京2022年冬奥会和冬残奥会利用智慧城市构建高质量生活服务体系提供理论框架,而且有助于将智慧信息技术领域的优势成果成体系地应用在城市的生活服务中,对于中国智慧城市的发展也有一定的指导价值。 -
人工智能与变革管理齐佳音伴随AI技术的不断突破,AI技术的巨大投入能否获得预期的高回报成为各界关注的问题。在这种背景下,学者们观测到AI生产率悖论现象,并引起关注;产业界的调研发现,人工智能应用有高达85%的失败率。到底是什么原因导致人工智能技术的产业应用效果未能达到预期?本书就是聚焦于这一核心问题,通过思辨篇、研究篇、案例篇、展望篇四个部分来体系化回答这一问题,试图给出破解AI生产率悖论现象的方案,即人工智能技术要转化为生产力,就需要为人工智能技术群的正向积极作用发挥创造与之相适应的新型管理模式、体系和方法,让新型技术与新型管理携手才能真正为 迎来 加美好的人工智能时代。 -
心见李长华 著本书的内容包括:对数字化概念进行梳理,回答什么是数字化的问题;对数字化的要素进行深入分析和描述,澄清数字化成功的关键要素;对主要的数字化的关键领域和问题,包括路径、组织、文化、业务与IT的关系以及数据价值等进行剖析;对数字化的组织和文化变革进行全面的总结; ,对数字化伦理和资本作为数字化的主要推动力等进行辩证分析。本书适合企业和政府部门的 以及数字化的实践者阅读。其中 包括董事长、CEO、CIO、CDO、CFO、CHRO、IT经理、业务经理等,实践者包括咨询顾问、架构师、需求分析师、项目经理、敏捷教练等。这些人在数字化工作中是关键人员,必须掌握数字化的核心知识。
