数据库
-
统计学贾俊平 吴翌琳本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
-
数据科学伦理[比]大卫·马滕斯(David,Martens)数据科学伦理是关于人们在进行数据科学方面的行为的道德规范。到目前为止,数据科学主要应用于企业和社会并产生了积极成果。然而,就像任何技术一样,数据科学也带来了一些负面后果:隐私侵犯的增加,对敏感群体的数据驱动的歧视以及使用不可解释的复杂模型做出决策。没有哪个数据科学家和业务经理是天生不道德的,只是他们没有接受过培训来考虑他们在工作中的伦理问题——本书旨在填补这个越来越重要的空白和解释不同的概念和技术,帮助读者理解从k-匿名和差别隐私到同态加密和零知识证明等技术已可以解决隐私侵犯问题,消除敏感群体歧视和提供各种可解释的人工智能。现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响,包括种族主义机器人的故事、搜索审查和人脸识别等。本书中穿插着结构化的练习,提供假设的场景和伦理困境,带读者一起思考如何平衡伦理问题和数据的效用。
-
6G无线网络空口关键技术袁弋非 黄宇红 丁海煜 崔春风 王启星本书从未来移动通信的应用场景出发,分析6G性能指标要求和频谱资源,结合无线接入网的网 络拓扑,对无线物理层的基本功能进行全面描述,包括移动性管理、无线传输、无线定位等。以第四代和第五代空口技术作为铺垫,自然过渡到6G。本书按照编码多址波形类、多天线空域类和高频段部署类三大技术领域,较为深入地介绍了6G无线网络潜在的关键技术。本书内容安排点面结合,文字叙述配合数学公式,强调网络拓扑、部署频段和信道传播特性对空口设计的影响。 本书面向的读者包括无线通信工程技术人员及科研院校的师生。
-
Power Query M函数语言侯翔宇 著 ; 颉腾文化 出品《Power Query M函数语言:基于Excel和Power BI的数据清理进阶实战》结合大量教学范例和逻辑示意图,深入介绍Microsoft Excel和Power BI中Power Query M函数语言数据清理技术的运行逻辑和进阶使用技巧。本书按照Power Query M函数语言的知识结构,在《Power Query M函数语言:基于Excel和Power BI的数据清理轻松入门》的基础上,详细、深入地介绍运算符、关键字、数据类型、函数的高级参数,以及高级函数和特殊函数等相关知识。《Power Query M函数语言:基于Excel和Power BI的数据清理进阶实战》共9章,分为3篇。第1篇“背景知识”,主要回顾“入门分册”的知识脉络,并展望本书的知识架构。第2篇“语法进阶”,首先介绍Power Query M函数语言的高级运算符,然后介绍循环、迭代和递归的相关知识,接着介绍关键词的相关用法,最后介绍错误数据和类型数据的相关知识。第3篇“函数进阶”,归纳总结M函数语言进阶人员必须要掌握的5大类函数的高级参数的通用模式,并给出30余项高级函数和特殊函数的用法。《Power Query M函数语言:基于Excel和Power BI的数据清理进阶实战》内容丰富,实例典型,非常适合有一定Power Query M函数语言基础而想要进一步深入学习的读者阅读,也适合想要在工作中使用Power Query M函数语言的从业人员阅读,另外还适合作为案头备用备查的手册。
-
数据认知手册撒迦利亚· 沃加里斯(Zacharias Voulgaris)在数据科学研究过程中,能快速解决问题是一项不可或缺的能力。但是数据科学面临的复杂性在于,随着大数据采集的数据量越来越大,以及最优解算法越来越复杂,很多算法面临着运行非常耗时,有时甚至在现有的资源情况下不可解的状况。此时,需要数据科学家发挥工程师思维,使用一些计算量小的近似方法,在节省时间和计算资源的前提下,得到不错的结果,这些方法可以称为启发式方法。本书聚焦“启发式方法”这个主题,分5个部分进行介绍。第1部分概述了各种类型的启发式方法;第2部分侧重于面向数据的启发式方法及其在数据科学问题中的应用;第3部分诠释了面向最优化的启发式方法,以及它们如何解决具有挑战性的最优化问题;第4部分是讲解如何设计和实施新的启发式方法,以解决特定问题的相关内容;第5部分介绍了关于启发式方法的其他主题,如透明度和局限性等。本书适合从事和计划从事数据科学领域相关工作的读者阅读。
-
PySpark大数据分析实战伍鲜 常丽娟本书是PySpark大数据分析的入门读物,适合有一定Python基础的读者学习使用。本书基于最新版本的PySpark 3.4.x编写,全书共11章,系统地介绍了PySpark大数据分析的方法和技巧,内容涵盖了大数据的相关技术、PySpark的基本概念、Spark环境搭建、数据分析的基本概念及相关工具、开发工具的选择、Spark核心编程和Spark SQL操作等基础知识和核心技术,以及Spark流式数据处理、Spark机器学习库MLlib和基于协同过滤的图书推荐系统等高级主题。本书通过多个实战案例,带领读者掌握使用Python和Spark进行大数据分析的方法和技巧,从而提高读者的数据处理能力和业务价值。 本书内容全面、示例丰富、讲解清晰,读者可以直接应用书中的案例。本书适合自学,也可作为计算机、软件工程、数据科学与大数据等专业的教学参考书,用于指导大数据分析编程实践,还可供相关技术人员参考。
-
高效使用Redis熊浩含 等全书主要分为三部分介绍Redis。第1部分介绍Redis6中使用的数据结构,包括动态字符串、跳跃表、压缩列表、字典、整数集合和快速链表,详细介绍其基本结构及常见操作。第二部分为本书核心篇章,首先介绍了Redis6的启动流程,命令解析流程,之后对Redis6中的命令实现进行了全面的介绍,包括键命令、字符串命令、哈希表命令、列表命令、集合及有序集合命令、地理位置相关的GEO命令、统计相关的HyperLogLog命令。第三部分,主要介绍了Redis6的一些特性及使用,包括事务、持久化、主从复制以及集群等。
-
用Python高效操作Excel很简单张善春 著《用Python高效操作Excel很简单》由浅入深地介绍如何通过Python语言高效、快捷地操作Excel,从而引领读者高效编写各种能自动生成Excel文件的代码。本书精讲Python操作Excel涉及的大部分知识点,并辅以130多个典型代码示例和2个项目实战案例,从而帮助读者轻松上手并快速提高。《用Python高效操作Excel很简单》共11章,分为3篇。第1篇“基础知识”,首先介绍Python开发环境的搭建和配置,然后介绍基本数据类型、运算符、控制语句、循环语句、函数、模块和类等Python语言的基础知识。第2篇“进阶实操”,首先介绍Openpyxl库的基本操作,然后介绍如何使用Openpyxl制作各种常见的Excel图形,最后介绍Openpyxl与Pandas交互操作的相关知识。第3篇“项目实战”,首先基于前文介绍的基础知识,从数据采集、数据清洗和创建数据报表等方面展示一个自动生成财务报表项目的开发过程,然后对项目涉及的数据进一步进行处理,并对资产负债率、现金比率和企业盈利等多项指标进行分析,最后制作相应的图表文件。《用Python高效操作Excel很简单》适合有一定Excel基础而想进一步提高工作效率的人员阅读,尤其适合文秘、行政、人事、营销和财务等相关行业的从业人员阅读,也可供Python编程爱好者参考。
-
用户画像赵宏田内容简介这是一本能指导企业对全渠道(公域和私域)用户进行画像并实现自动化营销和运营的实战性著作,是作者多年大数据研发和用户画像经验的总结。本书将帮助企业提高数字化营销和运营的水平,通过用户画像提升业绩。本书核心内容围绕App、企业微信、公众号、小程序、抖音、小鹅通6大用户渠道展开,从系统集成、数据接入、产品功能、开发实现、应用场景等多角度详尽地阐述了如何进行全渠道的用户画像并构建数字化的客户数据平台,实现营销和运营的数字化和自动化。除此之外,本书还介绍了全渠道用户画像的整体构建思路,各种营销自动化工具的应用场景、技术实现方案、使用方法、工程案例以及在全渠道画像平台上的实现,以及私域引流和触点相关的内容。这本书既有渠道集成技术方案实现、用户画像功能开发、客户数据平台搭建等技术方面的内容,又有针对各渠道的产品功能、应用场景的营销和运营方面的玩法,适合企业的产品经理、数据分析师、营销和运营人员、数据开发人员、技术开发人员阅读。
-
定量陷阱[英]克里斯托弗·纽菲尔德(Christopher,Newfield)等在数字时代,我们就可以完全相信数据吗对数字的过度依赖,是否会让经济学和人文学视角长期冲突是人类利用量化造福,还是量化用数字局限人类的思维本书是多篇文章的汇编。本书主要讲述了定量分析的弊端,通过对定量分析在实际运用中的分析,指出定量分析在很多时候并不能成为我们做判断的依据。本书肯定了定量分析有价值的部分,同时指出了定量分析的局限性和不正确使用带来的问题,提倡我们在运用中应综合定量分析与定性分析两种方式,根据实际情况进行选择。