数据库
-
Power Query M函数语言侯翔宇 著 ; 颉腾文化 出品《Power Query M函数语言:基于Excel和Power BI的数据清理进阶实战》结合大量教学范例和逻辑示意图,深入介绍Microsoft Excel和Power BI中Power Query M函数语言数据清理技术的运行逻辑和进阶使用技巧。本书按照Power Query M函数语言的知识结构,在《Power Query M函数语言:基于Excel和Power BI的数据清理轻松入门》的基础上,详细、深入地介绍运算符、关键字、数据类型、函数的高级参数,以及高级函数和特殊函数等相关知识。《Power Query M函数语言:基于Excel和Power BI的数据清理进阶实战》共9章,分为3篇。第1篇“背景知识”,主要回顾“入门分册”的知识脉络,并展望本书的知识架构。第2篇“语法进阶”,首先介绍Power Query M函数语言的高级运算符,然后介绍循环、迭代和递归的相关知识,接着介绍关键词的相关用法,最后介绍错误数据和类型数据的相关知识。第3篇“函数进阶”,归纳总结M函数语言进阶人员必须要掌握的5大类函数的高级参数的通用模式,并给出30余项高级函数和特殊函数的用法。《Power Query M函数语言:基于Excel和Power BI的数据清理进阶实战》内容丰富,实例典型,非常适合有一定Power Query M函数语言基础而想要进一步深入学习的读者阅读,也适合想要在工作中使用Power Query M函数语言的从业人员阅读,另外还适合作为案头备用备查的手册。 -
数据认知手册撒迦利亚· 沃加里斯(Zacharias Voulgaris)在数据科学研究过程中,能快速解决问题是一项不可或缺的能力。但是数据科学面临的复杂性在于,随着大数据采集的数据量越来越大,以及最优解算法越来越复杂,很多算法面临着运行非常耗时,有时甚至在现有的资源情况下不可解的状况。此时,需要数据科学家发挥工程师思维,使用一些计算量小的近似方法,在节省时间和计算资源的前提下,得到不错的结果,这些方法可以称为启发式方法。本书聚焦“启发式方法”这个主题,分5个部分进行介绍。第1部分概述了各种类型的启发式方法;第2部分侧重于面向数据的启发式方法及其在数据科学问题中的应用;第3部分诠释了面向最优化的启发式方法,以及它们如何解决具有挑战性的最优化问题;第4部分是讲解如何设计和实施新的启发式方法,以解决特定问题的相关内容;第5部分介绍了关于启发式方法的其他主题,如透明度和局限性等。本书适合从事和计划从事数据科学领域相关工作的读者阅读。 -
TensorFlow 2.x深度学习从入门到实战陈屹《TensorFlow 2.x深度学习从入门到实战》是作者研究和实践人工智能算法的经验总结。本书通过图表、案例和示例代码相结合的方式,介绍TensorFlow 2.x框架的相关知识,帮助读者打好扎实的人工智能理论基础,并将理论付诸实践,通过“干中学”的方式全面掌握复杂的算法理论。 《TensorFlow 2.x深度学习从入门到实战》共3篇。第1篇“TensorFlow基础”,主要介绍TensorFlow 2.x的基本开发方法及其重要接口的使用方法,让读者对其有较为全面的了解。第2篇“TensorFlow进阶”,详细介绍TensorFlow 2.x的高级开发功能,以及如何使用它开发基于深度学习的神经网络。第3篇“TensorFlow实战”,详细介绍TensorFlow 2.x在增强学习和GAN两个专业领域的强大应用,以及其最新调用接口和开发模式,帮助读者有效地将其应用到具体的项目实践中。 《TensorFlow 2.x深度学习从入门到实战》内容丰富,讲解透彻,适合对人工智能感兴趣的人员阅读,尤其是需要学习TensorFlow 2.x深度学习框架的入门与进阶人员,另外还适合相关培训机构作为培训教材使用。 -
YOLO目标检测杨建华,李瑞峰本书主要介绍基于视觉的YOLO框架的技术原理和代码实现,并讲解目标检测领域中的诸多基础概念和基本原理,在YOLO框架的基础上介绍流行目标检测框架。本书分为4个部分,共13章。第1部分介绍目标检测领域的发展简史、主流的目标检测框架和该领域常用的数据集。第2部分详细讲解从YOLOv1到YOLOv4这四代YOLO框架的网络结构、检测原理和训练策略,以及搭建和训练的YOLO框架的代码实现。第3部分介绍两个较新的YOLO框架——YOLOX和YOLOv7,着重讲解其设计理念、网络结构和检测原理。第4部分介绍DETR、YOLOF和FCOS在内的流行目标检测框架和相应的代码实现。本书侧重目标检测的基础知识,包含丰富的实践内容,是目标检测领域的入门书,适合对目标检测领域感兴趣的初学者、算法工程师、软件工程师等人员学习和阅读。 -
PySpark大数据分析实战伍鲜 常丽娟本书是PySpark大数据分析的入门读物,适合有一定Python基础的读者学习使用。本书基于最新版本的PySpark 3.4.x编写,全书共11章,系统地介绍了PySpark大数据分析的方法和技巧,内容涵盖了大数据的相关技术、PySpark的基本概念、Spark环境搭建、数据分析的基本概念及相关工具、开发工具的选择、Spark核心编程和Spark SQL操作等基础知识和核心技术,以及Spark流式数据处理、Spark机器学习库MLlib和基于协同过滤的图书推荐系统等高级主题。本书通过多个实战案例,带领读者掌握使用Python和Spark进行大数据分析的方法和技巧,从而提高读者的数据处理能力和业务价值。 本书内容全面、示例丰富、讲解清晰,读者可以直接应用书中的案例。本书适合自学,也可作为计算机、软件工程、数据科学与大数据等专业的教学参考书,用于指导大数据分析编程实践,还可供相关技术人员参考。 -
高效使用Redis熊浩含 等全书主要分为三部分介绍Redis。第1部分介绍Redis6中使用的数据结构,包括动态字符串、跳跃表、压缩列表、字典、整数集合和快速链表,详细介绍其基本结构及常见操作。第二部分为本书核心篇章,首先介绍了Redis6的启动流程,命令解析流程,之后对Redis6中的命令实现进行了全面的介绍,包括键命令、字符串命令、哈希表命令、列表命令、集合及有序集合命令、地理位置相关的GEO命令、统计相关的HyperLogLog命令。第三部分,主要介绍了Redis6的一些特性及使用,包括事务、持久化、主从复制以及集群等。 -
用Python高效操作Excel很简单张善春 著《用Python高效操作Excel很简单》由浅入深地介绍如何通过Python语言高效、快捷地操作Excel,从而引领读者高效编写各种能自动生成Excel文件的代码。本书精讲Python操作Excel涉及的大部分知识点,并辅以130多个典型代码示例和2个项目实战案例,从而帮助读者轻松上手并快速提高。《用Python高效操作Excel很简单》共11章,分为3篇。第1篇“基础知识”,首先介绍Python开发环境的搭建和配置,然后介绍基本数据类型、运算符、控制语句、循环语句、函数、模块和类等Python语言的基础知识。第2篇“进阶实操”,首先介绍Openpyxl库的基本操作,然后介绍如何使用Openpyxl制作各种常见的Excel图形,最后介绍Openpyxl与Pandas交互操作的相关知识。第3篇“项目实战”,首先基于前文介绍的基础知识,从数据采集、数据清洗和创建数据报表等方面展示一个自动生成财务报表项目的开发过程,然后对项目涉及的数据进一步进行处理,并对资产负债率、现金比率和企业盈利等多项指标进行分析,最后制作相应的图表文件。《用Python高效操作Excel很简单》适合有一定Excel基础而想进一步提高工作效率的人员阅读,尤其适合文秘、行政、人事、营销和财务等相关行业的从业人员阅读,也可供Python编程爱好者参考。 -
用户画像赵宏田内容简介这是一本能指导企业对全渠道(公域和私域)用户进行画像并实现自动化营销和运营的实战性著作,是作者多年大数据研发和用户画像经验的总结。本书将帮助企业提高数字化营销和运营的水平,通过用户画像提升业绩。本书核心内容围绕App、企业微信、公众号、小程序、抖音、小鹅通6大用户渠道展开,从系统集成、数据接入、产品功能、开发实现、应用场景等多角度详尽地阐述了如何进行全渠道的用户画像并构建数字化的客户数据平台,实现营销和运营的数字化和自动化。除此之外,本书还介绍了全渠道用户画像的整体构建思路,各种营销自动化工具的应用场景、技术实现方案、使用方法、工程案例以及在全渠道画像平台上的实现,以及私域引流和触点相关的内容。这本书既有渠道集成技术方案实现、用户画像功能开发、客户数据平台搭建等技术方面的内容,又有针对各渠道的产品功能、应用场景的营销和运营方面的玩法,适合企业的产品经理、数据分析师、营销和运营人员、数据开发人员、技术开发人员阅读。 -
定量陷阱[英]克里斯托弗·纽菲尔德(Christopher,Newfield)等在数字时代,我们就可以完全相信数据吗对数字的过度依赖,是否会让经济学和人文学视角长期冲突是人类利用量化造福,还是量化用数字局限人类的思维本书是多篇文章的汇编。本书主要讲述了定量分析的弊端,通过对定量分析在实际运用中的分析,指出定量分析在很多时候并不能成为我们做判断的依据。本书肯定了定量分析有价值的部分,同时指出了定量分析的局限性和不正确使用带来的问题,提倡我们在运用中应综合定量分析与定性分析两种方式,根据实际情况进行选择。 -
ChatGPT原理与架构程戈 著内容简介这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度 好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程; 1章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
