数据库
-
科研统计思维与方法马秀麟本书以实际案例和具体应用为驱动,以培养科研统计思维为目标,借助 SPSS,系统地讲授了差异显著性检验、方差分析、相关性分析、回归分析、聚类分析、主成分分析,以及结构方程模型的概念、原理和具体使用。全书共 8 章。第 1 章系统地讨论了科研统计思维及统计分析的相关概念,并以量化类典型论文为例抛出统计思维的核心问题。第 2 章介绍了数据的规范化及预处理,重点讲解了基于数据做论证所必需的前置操作。第 3 章介绍了统计描述及数据加工。第 4 章讲解了差异显著性检验。第 5 章介绍了方差分析及其高级应用,阐述了单因素方差分析、多因素方差分析、协方差分析、多因变量方差分析等内容,以及事后检验、均值边际图等高级应用的相关知识。第 6 章介绍了关联性分析技术和回归分析。第 7 章讲解了聚类分析技术。第 8 章介绍了因子分析与降维,主要讨论了探索性因子分析和验证性因子分析(结构方程模型)等方法。本书可作为量化研究相关专业本科生、研究生,以及大中专院校学生的教学用书,还可作为有志于了解量化研究方法和科研统计思维的科研人员、工程技术人员以及商务人员的参考用书。 -
IKCEST国际大数据竞赛赛题解析李轩涯 计湘婷 主编全书围绕IKCEST国际大数据竞赛,即IKCEST“一带一路”国际大数据竞赛暨百度&西安交大大数据竞赛展开,针对每次比赛内容进行深度解析,从任务、基础到冠军模型,以理论和代码相结合的方式,全流程深度剖析比赛过程。九次竞赛题均关注当年的热点领域和方向,分别是“人物关系”知识挖掘、提取子句中的核心实体、宠物分类、商家招牌分类、基于卫星遥感影像和用户行为的城市区域功能分类、高致病性传染病的传播趋势预测和基于车载影像的实时环境感知、“一带一路”重点语种法俄泰阿与中文互译、社交网络中多模态虚假信息甄别,涵盖了社交网络、计算机视觉、自然语言处理等大数据应用的热门领域。本书可作为全国高等学校大数据及相关专业的教材,也可作为感兴趣的读者了解IKCEST国际大数据竞赛的参考书。 -
从零构建向量数据库·珊瑚书罗云这是一本需要“动手实践”的图书,通过带领大家从零构建一款分布式向量数据库,让大家透彻理解向量数据库的技术原理和实现细节。本书共分为三大部分,内容由浅入深、循序渐进。“第一部分 认识向量数据库”(第1~3章)是基础篇,介绍向量数据库的基础知识,涵盖向量及数据库的基本概念、向量数据库的发展历程和核心功能。“第二部分 构建向量数据库”(第4~6章)是核心篇,详细介绍如何从零开始构建并优化向量数据库,巨细靡遗地展示数据库内核的技术实现细节并辅以代码示例、技术架构图等,旨在让大家真正实现动手写向量数据库。“第三部分 向量数据库的实践与展望”(第7~8章)是结束篇,通过实践案例展示向量数据库在AI应用中的使用方法,并尝试勾勒向量数据库的未来。本书面向数据库开发人员、数据库管理员、数据库架构师等数据库从业人员,AI从业者,及其他对向量数据库感兴趣的读者。 -
数据湖仓[美]比尔·恩门(Bill Inmon),[美]戴夫·拉皮恩(Dave Rapi数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,最终轻松、全面地管理数据湖仓项目。本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。 -
隐私保护机器学习J.Morris Chang机器学习应用需要大量的数据,因此有必要保护这些数据集中敏感信息的隐私和安全。从数据收集和导入到模型开发和部署,隐私保护发生在机器学习过程中的每个环节。这本实用的图书将讲授确保数据管道端到端安全所需的技能。《隐私保护机器学习》通过面部识别、云数据存储等真实世界中的用例来探讨隐私保护技术。你将了解到现在就可以部署的切实有效的实施方法、未来的隐私挑战以及如何调整现有技术以满足你的需求。你所学到的新技能将会在最后一章用来建立一个完整的安全数据平台项目。 -
时序大数据平台TDengine核心原理与实战TDengine团队本书由浅入深地阐述了时序大数据平台TDengine的核心原理与实战案例。首先,本书为读者提供了时序数据的基础知识和TDengine的核心特性概览,包括数据模型、数据写入、数据查询、数据订阅和流计算等;其次,详细介绍了TDengine的日常运维管理,包括安装部署、资源规划、图形化管理、数据安全等关键内容;然后,深入讲解了如何利用TDengine进行应用开发,涵盖多种编程语言的连接器使用、订阅数据,以及自定义函数的开发等高级功能;接下来,为数据库研发爱好者揭秘TDengine的内核设计,从分布式架构到存储引擎、查询引擎、数据订阅,再到流计算引擎的详细阐述;最后,通过分析典型应用场景案例,展示TDengine如何在实际业务中发挥作用。本书架构清晰,内容丰富,理论与实践相结合,适合作为需要使用TDengine进行大数据处理的开发者、架构师和产品经理的技术参考与培训资料。 -
数据结构俞勇、张铭、陈越、韩文弢本书是计算机领域本科教育教学改革试点工作计划(“101计划”)系列教材之一,秉承“发展经典,关注前沿;问题先导,内容溯源;章节灵活,难度适配”原则编写而成。全书共16章,包括绪论,线性表,栈与队列,字符串,树与二叉树,优先级队列,图,图应用,不相交集,内排序,查找与高级查找,外排序,查找与索引,算法基础,高级算法。本书提供配套教学课件、各章知识点教案、各章引入视频、配套实验教材(C、C 、Java、Python等语言实现),以及实践教学平台等教学资源,可作为高等学校计算机类专业本科生“数据结构”课程教材。 -
一本书讲透数据资产入表王琰 孟庆国 刘晗 朱越 等内容简介这是一部能指引零基础读者顺利完成数据资产入表的实操性著作。它不仅为读者提供了数据资产入表所需的全部知识,还给出了实际操作层面的方法指引;既是数据资产入表的初学者指南,也是企业实施数据资产入表操作的工作手册。本书由数据资产管理领域的标杆企业亿信华辰倾情奉献,同时融合了行业的先进实践经验,开创性提出“数据资产三次入表理论”(数据原始资源入表、数据产品入表、数据金融资产入表),得到了来自学术界和企业界的12位数据资产管理专家的高度评价和强烈推荐。本书分为四部分,不仅从战略、方法、工具、实操、案例等角度为读者提供了全面的数据资产入表知识体系,还前瞻性地探讨了数据资产入表后的价值挖掘、资产评估和金融创新。第一部分 数据资产入表全景概览(第1和第2章)深入分析数据资产入表的宏观背景、核心目标及其对企业乃至社会的价值,为读者描绘数据资产入表的时代意义和发展蓝图。第二部分 数据资产入表核心知识体系(第3~5章)详解数据资产入表所需的会计原理、法律框架和大数据技术基础,建立全面而深入的知识体系,为实操打下坚实基础。第三部分 数据资产入表实操指南(第6~9章)系统阐述实施策略与具体步骤,涵盖数据原始资源入表与数据产品入表的关键环节,提供详尽的实操指南。第四部分 数据资产入表后的价值挖掘(第10~13章)指导企业探索金融创新工具的应用,实现数据的资产化和资本化,释放数据资源的巨大潜在价值。此外,附录包含“数据资产入表36问”“数据要素相关标准清单”等内容,插页给出了“数据资产入表知识地图”。 -
EViews在数据分析中的应用何晓琦《EViews在数据分析中的应用》结合大量实战案例,全面、系统地介绍EViews软件的基本用法及其在数据分析中的应用。本书每章的最后都提供上机练习题,帮助读者提高动手能力。另外,本书提供配套教学视频,帮助读者高效、直观地学习,还提供教学PPT和大纲,方便相关高校的老师教学。《EViews在数据分析中的应用》共13章,分为4篇。第1篇“EViews数据分析基础”,涵盖EViews概述、EViews基本数据分析(单序列)、EViews基本数据分析(序列组)和EViews数据图形化分析;第2篇“EViews经典线性回归模型”,涵盖经典回归模型和违背经典线性回归模型假设的修正;第3篇“EViews时间序列模型”,涵盖时间序列模型与预测、带季节效应的时间序列模型、条件异方差模型、向量自回归模型和协整相关模型;第4篇“EViews的其他模型”,涵盖离散和受限因变量模型,以及混合数据与面板数据分析。《EViews在数据分析中的应用》内容丰富,结构合理,逻辑清晰,步骤详细,特别适合证券、银行、保险和投资等经济与金融行业中从事数据分析的相关人员阅读,也适合政府和工业制造等领域从事宏观经济分析与预测的数据分析人员阅读,还适合作为高等院校“EViews应用”“计量经济学”和“时间序列分析”等课程的教材。 -
用数据说话博蓄诚品 编著本书从读者熟悉的Excel出发,首先对数据的收集、整理、分析、多维透视进行了简要概述,接着引入了PowerBI,以实现对数据更精准的分析及可视化操作。全书共8章,内容包括如何使用Excel规范录入及整理数据源,如何使用函数、数据透视表及其他常见数据分析工具对数据进行加工,PowerQuery编辑器的应用、PowerBI数据建模、DAX公式的应用、报表的创建和编辑,以及可视化对象的数据交互等。在讲解过程中安排了大量的实操案例,以达到学以致用、举一反三的目的。本书结构合理,内容循序渐进、通俗易懂。本书适合Excel及PowerBI入门及进阶读者、数据分析新手阅读使用,同时可用作职业院校及培训机构相关专业的教材及参考书。
