数据库
-
科研统计思维与方法马秀麟本书以实际案例和具体应用为驱动,以培养科研统计思维为目标,借助 SPSS,系统地讲授了差异显著性检验、方差分析、相关性分析、回归分析、聚类分析、主成分分析,以及结构方程模型的概念、原理和具体使用。全书共 8 章。第 1 章系统地讨论了科研统计思维及统计分析的相关概念,并以量化类典型论文为例抛出统计思维的核心问题。第 2 章介绍了数据的规范化及预处理,重点讲解了基于数据做论证所必需的前置操作。第 3 章介绍了统计描述及数据加工。第 4 章讲解了差异显著性检验。第 5 章介绍了方差分析及其高级应用,阐述了单因素方差分析、多因素方差分析、协方差分析、多因变量方差分析等内容,以及事后检验、均值边际图等高级应用的相关知识。第 6 章介绍了关联性分析技术和回归分析。第 7 章讲解了聚类分析技术。第 8 章介绍了因子分析与降维,主要讨论了探索性因子分析和验证性因子分析(结构方程模型)等方法。本书可作为量化研究相关专业本科生、研究生,以及大中专院校学生的教学用书,还可作为有志于了解量化研究方法和科研统计思维的科研人员、工程技术人员以及商务人员的参考用书。 -
IKCEST国际大数据竞赛赛题解析李轩涯 计湘婷 主编全书围绕IKCEST国际大数据竞赛,即IKCEST“一带一路”国际大数据竞赛暨百度&西安交大大数据竞赛展开,针对每次比赛内容进行深度解析,从任务、基础到冠军模型,以理论和代码相结合的方式,全流程深度剖析比赛过程。九次竞赛题均关注当年的热点领域和方向,分别是“人物关系”知识挖掘、提取子句中的核心实体、宠物分类、商家招牌分类、基于卫星遥感影像和用户行为的城市区域功能分类、高致病性传染病的传播趋势预测和基于车载影像的实时环境感知、“一带一路”重点语种法俄泰阿与中文互译、社交网络中多模态虚假信息甄别,涵盖了社交网络、计算机视觉、自然语言处理等大数据应用的热门领域。本书可作为全国高等学校大数据及相关专业的教材,也可作为感兴趣的读者了解IKCEST国际大数据竞赛的参考书。 -
从零构建向量数据库·珊瑚书罗云这是一本需要“动手实践”的图书,通过带领大家从零构建一款分布式向量数据库,让大家透彻理解向量数据库的技术原理和实现细节。本书共分为三大部分,内容由浅入深、循序渐进。“第一部分 认识向量数据库”(第1~3章)是基础篇,介绍向量数据库的基础知识,涵盖向量及数据库的基本概念、向量数据库的发展历程和核心功能。“第二部分 构建向量数据库”(第4~6章)是核心篇,详细介绍如何从零开始构建并优化向量数据库,巨细靡遗地展示数据库内核的技术实现细节并辅以代码示例、技术架构图等,旨在让大家真正实现动手写向量数据库。“第三部分 向量数据库的实践与展望”(第7~8章)是结束篇,通过实践案例展示向量数据库在AI应用中的使用方法,并尝试勾勒向量数据库的未来。本书面向数据库开发人员、数据库管理员、数据库架构师等数据库从业人员,AI从业者,及其他对向量数据库感兴趣的读者。 -
用数据说话博蓄诚品 编著本书从读者熟悉的Excel出发,首先对数据的收集、整理、分析、多维透视进行了简要概述,接着引入了PowerBI,以实现对数据更精准的分析及可视化操作。全书共8章,内容包括如何使用Excel规范录入及整理数据源,如何使用函数、数据透视表及其他常见数据分析工具对数据进行加工,PowerQuery编辑器的应用、PowerBI数据建模、DAX公式的应用、报表的创建和编辑,以及可视化对象的数据交互等。在讲解过程中安排了大量的实操案例,以达到学以致用、举一反三的目的。本书结构合理,内容循序渐进、通俗易懂。本书适合Excel及PowerBI入门及进阶读者、数据分析新手阅读使用,同时可用作职业院校及培训机构相关专业的教材及参考书。 -
数据湖仓[美]比尔·恩门(Bill Inmon),[美]戴夫·拉皮恩(Dave Rapi数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,最终轻松、全面地管理数据湖仓项目。本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。 -
大数据技术与应用中国产业发展研究院本书是围绕我国国民经济和社会发展第十四个五年规划和2035 年远景目标等重大要求, 由中国通信学会、中国产业发展研究院联合组织编写的“新基建核心技术与融合应用丛书” 之一。大数据技术的战略意义不在于掌握庞大的数据信息, 而在于对这些含有意义的数据进行专业化处理。换而言之, 如果把大数据比作一种产业, 那么这种产业实现盈利的关键在于提高对数据的“加工能力”, 通过“加工” 实现数据的“增值”。本书立足数字经济浪潮, 以促进数据合规高效流通使用、赋能实体经济为主线, 重点围绕大数据采集、流通、安全、治理及应用等全生命周期进行编写, 覆盖大数据存储、计算、管理、安全与治理、资产管理与流通、分析、平台、产业与应用等环节, 对培育新质生产力, 推动我国数字经济高质量发展具有重要参考价值。本书适合IT、金融、研究机构相关从业人员以及高等院校相关专业的学生使用, 也可供对大数据感兴趣的读者阅读。 -
交通大数据应用技术与安全李雷孝,马志强,林浩 著本书系统阐述交通大数据在地面城市交通中的广泛应用,涵盖4个方面的内容。第一部分(包括第1、2章),主要介绍交通大数据相关背景、研究意义、基本特征定义和分类方法,是深入研究交通大数据不可或缺的先验知识;第二部分(包括第3~5章),以文本类型的结构化数据为基础,利用机器学习、数据挖掘等相关知识构造交通流量预测、交通拥堵预测、流量热点分析等模型;第三部分(包括第6、7章),通过视频和图像等媒体数据提供交通场景的视觉信息,以车载监控和道路监控为应用场景实现对驾驶员和车辆的监管;第四部分(包括第8、9章),主要介绍模型可视化呈现工具,以及交通大数据安全结合区块链的相关研究。本书可作为计算机相关专业、交通运输相关专业及从事两者交叉方向研究的教师、研究生、本科生和相关技术开发人员的参考用书。 -
隐私保护机器学习J.Morris Chang机器学习应用需要大量的数据,因此有必要保护这些数据集中敏感信息的隐私和安全。从数据收集和导入到模型开发和部署,隐私保护发生在机器学习过程中的每个环节。这本实用的图书将讲授确保数据管道端到端安全所需的技能。《隐私保护机器学习》通过面部识别、云数据存储等真实世界中的用例来探讨隐私保护技术。你将了解到现在就可以部署的切实有效的实施方法、未来的隐私挑战以及如何调整现有技术以满足你的需求。你所学到的新技能将会在最后一章用来建立一个完整的安全数据平台项目。 -
云数据安全去重技术唐鑫随着信息化建设的推进,电子数据资源成为企事业单位的重要基础设施。云计算因能够实现计算和存储资源按需分配、快速部署等而迅猛发展。越来越多的团体或个人倾向于将数据迁移至云存储系统,基于云的存储和计算应用已经深入金融、工业、交通、医疗健康等传统行业。安全、高效地提供云服务对于相关技术人员来说既是机遇也是挑战。本书从云数据安全存储这一视角切入,重点解决云数据去重技术中面临的安全和效率问题,提出并系统地讲解了一系列适用于抗侧信道攻击的云数据隐私保护去重技术。本书共9章: 第1章介绍了云数据去重技术的基础知识和国内外研究现状;第2、3章介绍了一些基于上传流量混淆的去重技术;第4~7章介绍了基于响应值混淆的去重技术;第8、9章介绍了基于广义去重的云数据安全存储技术。本书内容丰富,算法翔实,实用性强,适合社会各界人士阅读,尤其适合对云数据安全领域感兴趣的一般读者和从事网络空间安全相关领域工作的教学、科研人员以及在校本科生、研究生参考使用。 -
R语言实战 数据整理、可视化、建模与挖掘薛震 孙玉林本书是一本数据科学的入门与提升教程,全书共5篇,按照由浅入深、循序渐进的方式介绍R语言的基本语法与实际应用,并结合现实数据进行实战操作。内容涵盖R语言的安装与运行、数据对象的创建与编程、R语言初级与高级绘图、数据的管理与清洗、统计分析与数据降维、无监督与有监督学习、利用R Markdown创建动态报告和制作幻灯片等。本书为读者提供了相关案例的源码(获取方式见封底)。本书适合对数据可视化、统计建模、数据分析、数据挖掘感兴趣的研究人员和工程技术人员阅读,也可作为高等院校数学、统计学、数据科学、计算机科学、人工智能、云计算、大数据分析、生物医学、工业统计等方向本科生或研究生的参考教程。
