数据库
-
PySpark大数据分析实战伍鲜 常丽娟本书是PySpark大数据分析的入门读物,适合有一定Python基础的读者学习使用。本书基于最新版本的PySpark 3.4.x编写,全书共11章,系统地介绍了PySpark大数据分析的方法和技巧,内容涵盖了大数据的相关技术、PySpark的基本概念、Spark环境搭建、数据分析的基本概念及相关工具、开发工具的选择、Spark核心编程和Spark SQL操作等基础知识和核心技术,以及Spark流式数据处理、Spark机器学习库MLlib和基于协同过滤的图书推荐系统等高级主题。本书通过多个实战案例,带领读者掌握使用Python和Spark进行大数据分析的方法和技巧,从而提高读者的数据处理能力和业务价值。 本书内容全面、示例丰富、讲解清晰,读者可以直接应用书中的案例。本书适合自学,也可作为计算机、软件工程、数据科学与大数据等专业的教学参考书,用于指导大数据分析编程实践,还可供相关技术人员参考。 -
多元数据分析原理与实践杨寿渊本书是多元数据分析的基础教材,内容涵盖方差分析、总体分布和独立性检验、矩阵的奇异值分解、 多元线性回归分析、主成分分析、因子分析、聚类分析、多维标度分析、判别分析、逻辑回归分析、典 型相关分析等多元数据分析的核心内容。写作上力求深入浅出、循序渐进,既照顾学生的理解能力与学 习兴趣,又考虑内容的全面性与深度。本书在内容取舍、习题选择等方面依据作者的教学经验做了仔细 考虑,同时参考国内外的经典教材与文献,力求做到与时俱进,能够与前置和后续课程很好地衔接。 书 中除了方法原理讲解外,还有大量计算和应用实例,并附有完整的 MATLAB 代码和数据集,以及详细 的使用说明和代码注释,读者能够很容易地实现所学方法。每章末尾均有拓展阅读建议,供学有余力或 有兴趣的学生参考。此外,本书还配有用 LaTeX 精心制作的 PDF 课件,方便授课教师使用。 本书可作为基础数学、概率统计、应用数学、大数据、管理科学与工程、金融工程等专业的本科教 材,也可作为相关专业研究生基础课程的教材或参考书。 -
数智安全与标准化金涛、王建民、叶晓俊本书基于“全国信息安全标准化技术委员会大数据安全标准特别工作组”的工作,是一本关于数智安全与标准化的专业教材,旨在使读者在学习大数据、人工智能等数智技术与应用的同时,了解数智技术和应用的前沿以及相应的安全问题,理解数智安全与业务拓展和技术发展的伴生特性,掌握数智安全和标准化的基本知识,建立未来数智化所必须的安全发展意识、安全风险意识和技术安全意识。本书共分为17章,从法律合规、安全风险管理、网络系统安全、检测评估认证、个人信息安全、数据安全、人工智能安全、数智安全监管治理、数字经济发展等多个角度,系统地介绍了数智技术与应用的现状、挑战、机遇和前景,以及数智安全与标准化的重要性、原则、方法和实践。本书结合国内外的**研究成果和案例分析,深入浅出地阐述了数智安全与标准化的理论基础和实践指导,既有广度又有深度,既有理论又有实践,既有概念又有方法,旨在帮助读者全面掌握相关知识并运用于相关领域及应用。 本书可作为高等学校相关课程的教材,也可作为数智安全和标准化培训教材,还可为从事数智业务、系统、技术、安全开发及管理和标准化工作的人员提供参考。 -
高效使用Redis熊浩含 等全书主要分为三部分介绍Redis。第1部分介绍Redis6中使用的数据结构,包括动态字符串、跳跃表、压缩列表、字典、整数集合和快速链表,详细介绍其基本结构及常见操作。第二部分为本书核心篇章,首先介绍了Redis6的启动流程,命令解析流程,之后对Redis6中的命令实现进行了全面的介绍,包括键命令、字符串命令、哈希表命令、列表命令、集合及有序集合命令、地理位置相关的GEO命令、统计相关的HyperLogLog命令。第三部分,主要介绍了Redis6的一些特性及使用,包括事务、持久化、主从复制以及集群等。 -
用Python高效操作Excel很简单张善春 著《用Python高效操作Excel很简单》由浅入深地介绍如何通过Python语言高效、快捷地操作Excel,从而引领读者高效编写各种能自动生成Excel文件的代码。本书精讲Python操作Excel涉及的大部分知识点,并辅以130多个典型代码示例和2个项目实战案例,从而帮助读者轻松上手并快速提高。《用Python高效操作Excel很简单》共11章,分为3篇。第1篇“基础知识”,首先介绍Python开发环境的搭建和配置,然后介绍基本数据类型、运算符、控制语句、循环语句、函数、模块和类等Python语言的基础知识。第2篇“进阶实操”,首先介绍Openpyxl库的基本操作,然后介绍如何使用Openpyxl制作各种常见的Excel图形,最后介绍Openpyxl与Pandas交互操作的相关知识。第3篇“项目实战”,首先基于前文介绍的基础知识,从数据采集、数据清洗和创建数据报表等方面展示一个自动生成财务报表项目的开发过程,然后对项目涉及的数据进一步进行处理,并对资产负债率、现金比率和企业盈利等多项指标进行分析,最后制作相应的图表文件。《用Python高效操作Excel很简单》适合有一定Excel基础而想进一步提高工作效率的人员阅读,尤其适合文秘、行政、人事、营销和财务等相关行业的从业人员阅读,也可供Python编程爱好者参考。 -
用户画像赵宏田内容简介这是一本能指导企业对全渠道(公域和私域)用户进行画像并实现自动化营销和运营的实战性著作,是作者多年大数据研发和用户画像经验的总结。本书将帮助企业提高数字化营销和运营的水平,通过用户画像提升业绩。本书核心内容围绕App、企业微信、公众号、小程序、抖音、小鹅通6大用户渠道展开,从系统集成、数据接入、产品功能、开发实现、应用场景等多角度详尽地阐述了如何进行全渠道的用户画像并构建数字化的客户数据平台,实现营销和运营的数字化和自动化。除此之外,本书还介绍了全渠道用户画像的整体构建思路,各种营销自动化工具的应用场景、技术实现方案、使用方法、工程案例以及在全渠道画像平台上的实现,以及私域引流和触点相关的内容。这本书既有渠道集成技术方案实现、用户画像功能开发、客户数据平台搭建等技术方面的内容,又有针对各渠道的产品功能、应用场景的营销和运营方面的玩法,适合企业的产品经理、数据分析师、营销和运营人员、数据开发人员、技术开发人员阅读。 -
定量陷阱[英]克里斯托弗·纽菲尔德(Christopher,Newfield)等在数字时代,我们就可以完全相信数据吗对数字的过度依赖,是否会让经济学和人文学视角长期冲突是人类利用量化造福,还是量化用数字局限人类的思维本书是多篇文章的汇编。本书主要讲述了定量分析的弊端,通过对定量分析在实际运用中的分析,指出定量分析在很多时候并不能成为我们做判断的依据。本书肯定了定量分析有价值的部分,同时指出了定量分析的局限性和不正确使用带来的问题,提倡我们在运用中应综合定量分析与定性分析两种方式,根据实际情况进行选择。 -
6G无线网络空口关键技术袁弋非 黄宇红 丁海煜 崔春风 王启星本书从未来移动通信的应用场景出发,分析6G性能指标要求和频谱资源,结合无线接入网的网 络拓扑,对无线物理层的基本功能进行全面描述,包括移动性管理、无线传输、无线定位等。以第四代和第五代空口技术作为铺垫,自然过渡到6G。本书按照编码多址波形类、多天线空域类和高频段部署类三大技术领域,较为深入地介绍了6G无线网络潜在的关键技术。本书内容安排点面结合,文字叙述配合数学公式,强调网络拓扑、部署频段和信道传播特性对空口设计的影响。 本书面向的读者包括无线通信工程技术人员及科研院校的师生。 -
统计学贾俊平 吴翌琳本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。 -
数据科学伦理[比]大卫·马滕斯(David,Martens)数据科学伦理是关于人们在进行数据科学方面的行为的道德规范。到目前为止,数据科学主要应用于企业和社会并产生了积极成果。然而,就像任何技术一样,数据科学也带来了一些负面后果:隐私侵犯的增加,对敏感群体的数据驱动的歧视以及使用不可解释的复杂模型做出决策。没有哪个数据科学家和业务经理是天生不道德的,只是他们没有接受过培训来考虑他们在工作中的伦理问题——本书旨在填补这个越来越重要的空白和解释不同的概念和技术,帮助读者理解从k-匿名和差别隐私到同态加密和零知识证明等技术已可以解决隐私侵犯问题,消除敏感群体歧视和提供各种可解释的人工智能。现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响,包括种族主义机器人的故事、搜索审查和人脸识别等。本书中穿插着结构化的练习,提供假设的场景和伦理困境,带读者一起思考如何平衡伦理问题和数据的效用。
