数据库理论
-
文本数据挖掘宗成庆、夏睿、张家俊文本数据挖掘是通过机器学习、自然语言处理和推理等相关技术或方法,理解、分析和挖掘文本的内 容,从而完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。《文本数据挖掘(第2版)》主 要介绍与文本数据挖掘有关的基本概念、理论模型和实现算法,包括数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分析与观点挖掘、话题检测与跟踪、信息抽取以及文本自动摘要等,后通过 具体实例展示相关技术在实际应用中的使用方法。《文本数据挖掘(第2版)》书可作为高等院校计算机、自动化、网络安全、大数据分析等专业,以及利用到文本信息处理的交 叉学科(如金融财经、社会人文、生物医药等)的高年级本科生或研究生从事相关研究的入门参考书,也可供相关技术研发人员阅读和参考。
-
图解大数据分析渡部徹太郎 著本书通过大量的绘图和详细的说明,从技术层面以简单易懂的形式讲述大数据分析。这是一本从系统结构搭建到实际开发逐步推进的教科书。书中的知识点包括大数据分析时所需的分布式处理、机器学习,以及分布式存储、分布式计算、开发时可能遇到的瓶颈,还包括大数据的收集、积累、活用以及元数据的使用与管理等。本书适合大数据领域的广大爱好者、商务人士和工程技术人员用于了解、学习、掌握、运用大数据技术进行大数据分析,也适合作为该领域的职业院校和高校本科相关专业的教材及研究生辅助教材。
-
matplotlib数据可视化实战洪锦魁《matplotlib数据可视化实战》借助matplotlib讲解开展数据可视化实践所需要掌握的关键知识和技能,从设置图表基础元素(坐标轴、标签、颜色、数学符号等),到根据表现内容绘制不同类型的图表(折线图、条形图、圆饼图、小提琴图等),全面讲解了 matplotlib 的使用方法。为方便读者学习,书中对相关操作都配以案例及代码进行讲解,读者可以根据自身需求,灵活使用其中的函数和语句。本书适合数据分析、数据可视化领域的爱好者、从业者阅读,也适合作为高校相关专业的教材。
-
Data Mesh权威指南[澳]扎马克·德加尼(Zhamak Dehghani)本书介绍了数据网格——一种来自现代分布式架构的去中心化社会技术范式,它提供了一种大规模采购、共享、访问和管理分析型数据的新方法。本书分为五部分。第1部分介绍Data Mesh的四个原则,以及它们所组成的高级模型。第二部分比较Data Mesh与以前的数据架构的区别。第三部分介绍Data Mesh组件的高层次架构,帮助你设计Data Mesh架构以及评估与Data Mesh匹配的现成技术。第四部分介绍Data Mesh中的一个核心概念(数据产品)的详细设计,帮助你识别与Data Mesh愿景兼容的设计技术,并将它们与不兼容的技术区分开来。第五部分介绍如何演进式地执行Data Mesh的转换,以及如何围绕团队结构、激励、文化等做出组织设计决策的可行建议。
-
数据结构知识点与习题精讲王彤、杨雷、鲍玉斌、张立立本书是计算机专业课学习和研究生入学考试数据结构课程的复习用书,将知识点与习题以“微课视频 书本”形式呈现,内容包括绪论,线性表,栈、队列、数组,串,树和二叉树,图,查找,排序。本书以全国硕士生入学考试大纲(统考)所考查知识点为主线,结合热门院校自主命题所考查知识点,对知识点进行归纳、总结,以计算机专业数据结构本科教学大纲、知识点、习题紧扣计算机考研数据结构大纲。知识点部分,力求内容精练、讲解清晰、重点和难点突出,包含学习目标、知识点导图、知识点归纳、重点和难点知识点详解;习题部分,力求思路清晰,引导读者完成知识点内化,实现举一反三,包括层次化的模拟题和详解、考研真题和详解,模拟题又进一步细化为基础习题和进阶习题。专业课学习和考研读者可选择练习基础和进阶习题部分,考研读者可继续完成考研真题部分。知识点和习题均配有微课视频讲解,力求摆脱单一书本的学习方式,通过直观、高效的微课视频帮助读者深入掌握知识点并灵活解题,读者根据需要扫描二维码即可获取。 本书可作为参加计算机专业研究生入学考试考生的复习用书,也可作为高等院校计算机科学与技术专业和相关专业本科生及研究生学习数据结构课程的辅导用书,还可作为从事计算机工程与应用工作的科技人员的参考书。
-
让数据成为生产力孙丹 沈寓实 赵勇数据作为新型生产要素,推动经济发展、提升生产力。本书从数据的基础认知、数据圈的诞生和发展以及数据蕴含的未来等角度开始谈起,进一步讨论了数据全生命周期管理的核心节点,以及企业数据应用和管理的难点与重点,最后从数据传统应用的不同领域进行解读分析,全面阐释了什么是数据、数据的应用以及数据的未来等内容。通过本书,读者可以感受到数据开启的美好新时代,也可以预期在各行各业中,数据拥有将不可能变为可能的超能力。 全书共9章。第1章为基础章节,着重介绍了数据基本认知,包括数据起源、概念以及不断膨胀的数据圈;第2章对数据的不同类型、数据来源以及数据的创建位置等进行了深入介绍,让读者对数据有更全面的认知;第3章对于当前的数据以及数据的未来进行了分析和探讨; 第4~9章重点着墨于数据的应用,介绍了数据全生命周期管理的相关内容,分析了企业数据应用的困境和重点,并且列举了数据应用较为突出的领域和前沿领域作为参考。本书全面、客观地从基础理论到应用实践,将数据生动、全面地展现在读者面前。 本书适合数据产业从业人士、研究人员,政府、高校、传统企业、科技行业从业者,正在进行数字化转型的企业管理者及员工,以及对数据经济、数字化转型有兴趣的相关人员阅读。
-
算法设计与分析王秋芬 赵刚彬本书注重理论与实践紧密结合,系统介绍算法设计方法、分析技巧和 C 编程实战。作者本着“易理 解,重实用”的指导思想,结合多年的教学经验,以算法设计策略为主线,沿着“算法思想—算法设计—构造 实例—算法描述—算法分析—C 实战”的思路组织学习内容,共包括算法及基础知识、贪心法、分治法、动 态规划、搜索法、随机化算法、线性规划问题与网络流、数论算法及计算几何算法和 NP完全理论等9章内 容。为突出教材的可读性、可用性及前沿性,每章增设了学习目标、阅读材料及习题解析,配套资源包括实 验指导书、教学大纲、教学课件、经典案例源代码、微课视频、课程网站等内容。 本书内容丰富、思路清晰、实例讲解详细、图例直观形象,适合作为计算机及其相关专业的本科生和研 究生教材,也可供工程技术人员和自学读者学习参考,还适合作为参加 ACM 程序设计大赛的爱好者的参 考书或培训教材。
-
大数据分析张聪、曹文琪、张俊杰、喻子言本书将基础理论和算法实现相结合,介绍了关于大数据分析中的相关知识,全面、系统地介绍有关算法的实现过程,并对算法在相关实例上的应用结果进行分析。全书共8章,内容包括差异化空间插值模型的理论原理、利用空间信息的大数据分析预测过程、协作复合神经网络模型的基础架构、利用相关特征的大数据分析预测过程、并行支持向量机的基本原理、并行支持向量机下的风险分类评价研究、集成学习与贝叶斯优化的相关理论和结合贝叶斯优化与集成学习的大数据评价研究等知识。书中每种算法都以伪代码的形式进行描述并附有相应的实例。 本书主要面向广大从事大数据分析、机器学习、数据挖掘或深度学习的专业人员,从事高等教育的专任教师,高等院校的在读学生及相关领域的广大科研人员。
-
分数阶微积分学薛定宇、白鹭本书系统地介绍分数阶微积分学领域的理论知识与数值计算方法。特别地,作者提出并实现一整套高精度的分数阶微积分学的数值计算方法;提出线性、非线性分数阶微分方程的通用数值解法和基于框图的通用仿真框架;提出并实现了基于框图的分数阶隐式微分方程、延迟微分方程与分数阶微分方程边值问题的通用求解方法。本书所有知识点均配有高质量的MATLAB代码与Simulink模型,有助于读者更好地理解知识点的内涵,更重要地,可以利用代码实践并创造性地解决相关问题。 本书可供数学与应用科学领域的高年级本科生、研究生与工程师系统学习分数阶微积分学理论及其计算方法,并用其解决实际应用问题。
-
核事故下气载放射性核素的辐射风险预测研究李新鹏《核事故下气载放射性核素的辐射风险预测研究》阐明工况缺失与复杂环境条件下,辐射预测不确定性的产生机理、传递机制和模型不匹配现象,提出精细建模方法、联合估计方法和通用型剂量计算方法,并通过数值模拟实验、风洞实验和真实场地实验的系统性验证,减少模型偏差及其在计算链中的传递,消减模型不匹配带来的后果评估偏差,建立一套验证充分、稳健准确的放射性风险预测理论框架,提高核事故应急后果评价系统的评价效果,满足严重核事故与先进堆的核应急需求。 《核事故下气载放射性核素的辐射风险预测研究》可作为高校或科研机构核事故应急、核安全等相关领域学者和研究人员的参考书。