数据库
-
数据工程基础Joe Reis数据工程在过去十年间发展迅速,许多软件工程师、数据科学家和分析师都在寻找相关实践的全面观点。通过这本实践用书,你将学习如何通过评估数据工程生命周期框架中可用的最佳技术来规划和构建系统,以满足你的组织和客户的需求。作者Joe Reis和Matt Housley将为你介绍数据工程的生命周期,向你展示如何综合运用各种云技术,以满足下游数据消费者的需求。你将理解如何应用数据生成、摄取、编排、转换、存储和治理的概念,无论底层技术是什么,这些概念在任何数据环境中都至关重要。
-
机器学习中的交替方向乘子法林宙辰,李欢,方聪使用机器学习技术解决实际应用问题涉及模型的建立、训练及评估等步骤。优化算法常被用于训练模型的参数,是机器学习的重要组成部分。机器学习模型的训练可以建模成无约束优化问题或带约束优化问题,约束可以为模型增加更多的先验知识。基于梯度的算法(例如加速梯度法、随机梯度法等)是求解无约束优化问题的常用方法,而交替方向乘子法(ADMM)则是求解带约束优化问题的有力工具。《BR》本书概述了机器学习中ADMM的新进展。书中全面介绍了各种情形下的ADMM,包括确定性和随机性的算法、集中式和分布式的算法,以及求解凸问题和非凸问题的算法,深入介绍了各个算法的核心思想,并为算法的收敛性和收敛速度提供了详细的证明。
-
中国电子信息工程科技发展研究中国信息与电子工程科技发展战略研究中心当前,大数据不仅是推进网络强国建设的重要领域,更是新时代加快实体经济质量变革、效率变革、动力变革的战略依托。《BR》本书首先简要阐述了大数据的概念、特征和主要发展阶段,并对我国的国家和地方大数据产业政策进行了详细的梳理。在大数据技术章节,按照数据的生命周期对数据采集、存储、计算、管理、应用和安全技术进行了简要的介绍。针对大数据产业,重点从产业发展现状和相关产业主体进行分析。在大数据应用领域,简要介绍了大数据在数字经济、通信、政务、金融、工业等领域的融合应用情况。最后就数据资产、数据要素和大数据法制的发展现状和趋势进行了简要分析和介绍。
-
人工智能伦理困境与突破周翔本书共分为八章。 章是绪论部分,简单梳理了目前 外关于人工智能伦理问题的相关研究,确定了本书的研究目的、研究思路与研究方法。第二章主要介绍了人工智能的发展历史以及五种主要应用类型,同时从经济、文化道德与社会生活三个方面阐述了人工智能对人类的影响。第三章简单介绍了人工智能伦理思想流变。第四章在各类人工智能伦理困境的基础上,结合现代社会分析了人工智能和人工智能体发展中面临的现实伦理困境。从人工智能与道德的关系方面进行论述,指出了人工智能存在的伦理道德问题,并分析了成因。第五章从人工智能研发、人类自身与建立制度三个层面针对人工智能出现的伦理问题提出了应对策略。第六章将人工智能伦理与传统伦理道德进行了比较,从构建人工智能伦理角度探究了人工智能和人的伦理道德的冲突与一致性,从传统道义论、功利论相关角度对人工智能伦理进行系统分析,进一步思考人工智能体的道德与美德、权利与义务。全面分析人工智能发展中的伦理困境和应对策略以后,系统阐述了人工智能与传统伦理学相关理论的融合发展。第七章具体论述了混合形式的人工智能伦理体系的建构,从美德与道德角度建构人工智能伦理系统,分别分析了“自上而下”的道德设计和混合道德伦理学。第八章对全书进行总结与思考,希望能够将人工智能技术与社会伦理道德结合起来,建构人工智能伦理学,让人工智能体和我们人类互相促进、共同发展,让人工智能 好地惠及我们全人类。
-
一本书读懂边缘计算史皓天 段嘉 刘沁源 编著本书是一本介绍边缘计算的技术科普书。全书共6章,介绍了什么是边缘计算、边缘计算的相关技术有哪些、边缘计算适用的场景,介绍了边缘计算行业组成和生态现状,*后通过业界专家的视角,分享了业界对于边缘计算行业的看法和展望,深入浅出地介绍了边缘计算的技术、现状及发展前景。本书内容专业、全面,覆盖当前技术前沿,用通俗易懂的表述满足大众了解和掌握边缘计算的需求。本书适合边缘计算及物联网行业相关从业者、对边缘计算感兴趣的读者阅读。
-
数据网格[美]扎马克·德加尼我们正处于数据的拐点,现今的数据管理解决方案已经不符合组织的复杂性、数据源的激增以及我们希望通过人工智能和分析从数据中获得价值的愿景。在这本实践用书中,作者Zhamak Dehghani介绍了数据网格,这是一种去中心化的社会技术范式,取自现代分布式架构,为大规模获取、共享、访问和管理分析数据提供了新方法。Dehghani指导从业者、架构师、技术领导人和决策者从传统大数据架构转向分布式多维分析数据管理方法。数据网格将数据视为产品,将领域视为主要关注点,应用平台思维创建自助式数据基础架构,并引入数据治理的联合计算模型。
-
全球数据跨境流动治理何跃鹰,卓子寒数字经济已成为各国经济增长的新动能,并上升为国家发展战略,各国政府和人民对数据跨境流动安全问题的关注与日俱增。本书系统介绍了全球数据跨境规则的产生背景及其发展演变的脉络,重点分析了全球主要国家和地区数据跨境治理规则的内容和相互之间的异同,特别介绍了欧盟、美国话语权下的数据跨境流动规则及规则间的弥合,也介绍了其他国际性文件及十余个重点国家和地区的立法现状,同时展望了全球数据跨境规则的未来走向,在此基础上对我国的数据跨境流动治理规则现状进行梳理,并对其实施与完善提出了相关建议。本书语言平实易读,主要以法律法规、执法部门的解释性指南、判决书等一手资料作为参考,介绍分析了国内外立法现状和法律实践。
-
数据库系统概论王珊 杜小勇 陈红本书第1版于1983年出版,至今已修订至第6版。教材出版近40年来为全国数百所高校采用。本书三次荣获优秀教材奖(1988年、2002年、2021年)。相应课程先后入选北京市精品课程、精品课程、精品资源共享课程、精品在线开放课程和一流本科课程。 本书系统全面地阐述了数据库系统的基础理论、基本技术和基本方法。全书分为4篇18章。篇基础篇,包括绪论、关系数据模型、关系数据库标准语言SQL、数据库安全性和数据库完整性,共5章。第二篇设计与应用开发篇,包括关系数据理论、数据库设计和数据库编程,共3章。第三篇系统篇,包括关系数据库存储管理、关系查询处理和查询优化、数据库恢复技术、并发控制和数据库管理系统概述,共5章。第四篇新技术篇,包括数据库发展概述、大数据管理系统、数据仓库与联机分析处理、内存数据库系统、区块链与数据库,共5章。 本书可以作为高等学校计算机科学与技术专业、软件工程、数据科学与大数据技术、信息系统与信息管理等相关专业数据库课程的教材,也可供从事数据库系统研究、开发和应用的研究人员和工程技术人员参考。
-
构建数据湖仓美 比尔·恩门,美 玛丽·莱文斯 著;上海市静安区国际数据管理协会译在数据湖仓的所有新增要素中,排名第一的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规划。
-
Pandas数据分析快速上手500招罗帅、罗斌本书采用“问题描述+解决方案”模式,通过500个案例介绍了使用Pandas进行数据分析和数据处理的技术亮点。全书共分为8章,主要案例包括:读写CSV、Excel、JSON、HTML等格式的数据;根据行标签、列名和行列数字索引筛选和修改数据,使用各种函数根据数据大小、日期范围、正则表达式、lambda表达式、文本类型等多种条件筛选数据;统计NaN(缺失值)的数量、占比,根据规则填充和删除NaN;在DataFrame中增、删、查、改行列数据,计算各种行差、列差、极差以及直接对两个DataFrame进行加、减、乘、除运算和比较差异;将宽表和长表相互转换,创建交叉表和各种透视表;对数据分组结果进行求和、累加、求平均值、求极差、求占比、排序、筛选、重采样等多种形式的分析,将分组数据导出为Excel文件。本书还附赠36个数据可视化案例,如根据指定的条件设置行列数据的颜色和样式,根据行列数据绘制条形图、柱形图、饼图、折线图、散点图、六边形图、箱形图、面积图等。本书适于作为数据分析师、物流分析师、金融分析师、数据产品开发人员、人工智能开发人员、市场营销人员、办公管理人员、Python程序员等各行各业人员的案头参考书,无论对于初学者还是专业人士,本书都极具参考和收藏价值。