数据库
-
大数据关键技术与应用创新窦万春、杨剑、代飞本书十章内容分属上、中、下三篇。上篇为大数据关键技术篇,从数据、信息和知识内在的关联逻辑出发,技术结合实例,从技术体系的基本原理、核心技术的要素组成等方面,对大数据应用的基本原理和关键技术进行了系统的论述。并对大数据体系的技术生态环境进行了分析梳理。中篇为教育大数据应用创新篇,从支持“有效学习”的角度,利用知识图谱对教育大数据进行聚合分析,提出了支持现代教育技术创新的大数据应用方案和技术赋能路径。下篇为大数据应用拓展篇,重点从技术框架出发,理论结合实践,全方位地探讨大数据技术在不同应用领域中的理念方法与技术创新思路。本书围绕大数据及其相关技术这一主题,采用深入浅出的叙述方式,阐述大数据及其相关技术的基本理论、关键技术和实际应用,目的是让广大师生以计算机公共基础课程为知识载体,进一步了解大数据的理论知识与应用方法。在撰写上,本书既体现了大数据技术本身的系统性和理论性,从关键技术的提炼到技术生态的构建,再到典型应用案例的分析,将数据科学的发展与行业的实践应用紧密结合,又注重带有人文气息的启发式学习策略,探寻教育规律与科技、人文的充分融合,关注培养学生的人文科技情怀,是一本大数据理论与技术的精品教程。
-
网络科学与网络大数据结构挖掘刘伟 著网络科学是一门正在兴起的交叉性学科,与社会学、贸易物流、管理学等都密切相关。《网络科学与网络大数据结构挖掘》致力于系统地介绍网络科学的基本概念、思想和方法,使得具有高等数学基础的读者都能够看懂,并具备把网络科学方法用于实际网络分析的能力。《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导,而是更为关注网络科学的思维习惯和研究方式,兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员学习参考。
-
社交媒体中的电子医疗数据挖掘与网络分析杨东辉电子医疗健康(E-healthcare)领域因其关系民众身心健康且囊括很多相关主题内容,成为近需求强烈和应用较为广泛的前沿领域。针对社交媒体平台上医疗健康领域的多文本和复杂网络特性,精准医疗用户数据挖掘和社会网络分析等内容是重要的研究课题。本书首先在章中介绍了电子医疗健康时代下面临的科学问题和推荐系统研究现状。然后,在第二章中介绍了社交媒体平台上的文本数据和网络数据收集方法;第三章介绍了数据挖掘的知识,包括5个典型分类算法(k-近邻、决策树、支持向量机、随机森林、梯度提升决策树)和3个典型的聚类算法(k-means、层次聚类、孤立森林),通过Weka软件和python语言的使用,讲解如何实现这些数据挖掘方法。接着,在第四章中以微博平台上的电子医疗健康主题为例,阐述了基于文本特征集合构建和特征选择的情感分类,并提出了一种情感相似度计算方法。第五章是社会网络分析在社交媒体平台的应用,展示了如何使用随机指数图模型进行网络连接预测。后,在第六、七章中对社会化影响力衡量与社会化推荐系统的研究工作。并利用糖尿病微博数据进行社会化推荐的实证分析,验证本方法的有效性、优越性及可推广性。
-
大数据分析的九堂数学课(德)弗拉基米尔·什克曼,(德)大卫·穆勒 著 李泽宇 译本书分为10章,其中第1~9章探讨了排序、推荐系统、聚类、线性回归等内容,每章都以一个具体的实际问题开始,其主要目的是激发对某一特定大数据分析技术的研究。接下来探讨其背后的数学原理——包括重要的定义、辅助陈述和得出的结论。案例研究有助于将所学知识应用于跨学科的环境中,包括对逐步任务的描述和有用的提示。每章之后都配有习题,作为自学中不可缺少的一部分,有助于提高对基础理论的理解。第10章提供了前9章的习题答案,以及Python代码中的算法描述作为补充材料。本书适合作为大数据分析、应用数学及相关专业的研究生和高年级本科生。
-
Hyperledger区块链开发实战[美]尼廷 高尔 等区块链和Hyperledger技术是当今的热门话题。Hyperledger Fabric和Hyperledger Composer是开源项目,能够帮助组织机构创建私有的许可区块链网络,它们在金融、银行、供应链和物联网等领域都有应用。《Hyperledger区块链开发实战》将是使用Hyperledger技术探索和创建区块链网络的简单参考。本书首先概述了区块链的演变过程,包括相关区块链技术的总览。你将学习如何配置Hyperledger Fabric,并熟悉其体系结构组件。使用这些组件,你将学习构建私有区块链网络,以及连接到这些网络的应用。首先从原理开始,你将学习设计和启动一个网络,在链码中实现智能合约等。在本书的结尾,你将能够构建和部署自己的去中心化应用程序,解决区块链生命周期中遇到的关键痛点。《Hyperledger区块链开发实战》适合IT技术人员、区块链开发人员以及高等院校区块链工程、信息安全、物联网工程等专业师生阅读。
-
大数据相似查询关键技术研究孙佶 著《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。《大数据相似查询关键技术研究》共五章:第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。第4章基于相似查询的数据融合规则生成,介绍了一种基于相似查询的人在回路实体融合系统。第5章总结与展望,总结了全书的主要研究工作,并对未来的工作做出展望。
-
中国电子信息工程科技发展研究中国信息与电子工程科技发展战略研究中心数据中心网络是数据中心的重要组成部分,为数据中心提供传输性能保障。在当前东数西算和全国一体化大数据中心建设的背景下,数据中心网络技术的重要性愈发凸显。本书从数据中心网络的高性能、可编程、虚拟化、智能化等关键技术的角度出发,对近年来数据中心网络的技术发展进行梳理(第2章),提炼国内外数据中心网络的发展态势(第3~4章),并且对未来数据中心网络的发展前景进行了展望(第5章)。
-
数据科学中的实用线性代数(荷)迈克·X.科恩如果你想从事计算或技术领域的工作,理解线性代数是少不了的。线性代数的研究对象是矩阵及其运算,是几乎所有计算机算法和分析的数学基础。但它在几十年前的教科书中的呈现方式与专业人员如今用来解决现实世界问题的方式有很大不同。这本来自Mike X Cohen的实用指南讲授了以Python实现的线性代数的核心概念,包括如何在数据科学、机器学习、深度学习、计算模拟和生物医学数据处理应用中使用它们。有了这本书,理解、实现和适应繁多的现代分析方法和算法将不再是问题。
-
区块链前沿实践鲁静 任世奇 程晗蕾近年来,针对互联网数据滥用、平台垄断、隐私泄漏等问题,全球兴起了Web3.0探索热潮,力图通过区块链等技术重构新一代互联网。2021年,国家《“十四五”数字经济发展规划》中指出,要推动数字技术在数据流通中的应用,鼓励企业、研究机构等主体基于区块链等数字技术探索数据授权使用、数据溯源等应用,提升数据交易流通效率;2022年,国务院《关于数字经济发展情况的报告》中也指出,数字经济成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量,其发展离不开区块链等数字产业。区块链的分布式账本和智能合约实现了数据的确权、定价、交易和赋能,是Web3.0中数字经济的“新基建”,也是元宇宙的创作者所有权经济的基础。本书以笔者团队负责的真实区块链应用案例为蓝本,深度剖析了区块链如何赋能金融科技、智慧能源、企业管理和社会治理,并在此基础上构筑了数字经济与实体经济融合发展的区块链应用版图,为当前数字经济相关从业人员提供了重要的理论指引与实践参考,是一本不可多得的区块链案例精析著作。
-
大数据决策分析吴添本书将大数据分析用于管理实践与政策评估中的多个应用场景,运用管理学、数据科学、系统工程、交通工程、统计学、数学等不同学科的分析模型和研究方法,实现多学科的深度交叉融合,促进数据建模与预测科学的发展。本书的研究内容将有助于提升管理者的决策能力和创新效率,揭示决策范式转变的机理与规律,开展以决策支撑为导向的科学治理,探索研究成果转化政策建议及优化决策模式的有效路径,将研究成果快速转化为政策建议,并直接应用于不同层级的辅助决策。