数据库
-
PySpark大数据分析实战伍鲜 常丽娟本书是PySpark大数据分析的入门读物,适合有一定Python基础的读者学习使用。本书基于最新版本的PySpark 3.4.x编写,全书共11章,系统地介绍了PySpark大数据分析的方法和技巧,内容涵盖了大数据的相关技术、PySpark的基本概念、Spark环境搭建、数据分析的基本概念及相关工具、开发工具的选择、Spark核心编程和Spark SQL操作等基础知识和核心技术,以及Spark流式数据处理、Spark机器学习库MLlib和基于协同过滤的图书推荐系统等高级主题。本书通过多个实战案例,带领读者掌握使用Python和Spark进行大数据分析的方法和技巧,从而提高读者的数据处理能力和业务价值。 本书内容全面、示例丰富、讲解清晰,读者可以直接应用书中的案例。本书适合自学,也可作为计算机、软件工程、数据科学与大数据等专业的教学参考书,用于指导大数据分析编程实践,还可供相关技术人员参考。 -
高效使用Redis熊浩含 等全书主要分为三部分介绍Redis。第1部分介绍Redis6中使用的数据结构,包括动态字符串、跳跃表、压缩列表、字典、整数集合和快速链表,详细介绍其基本结构及常见操作。第二部分为本书核心篇章,首先介绍了Redis6的启动流程,命令解析流程,之后对Redis6中的命令实现进行了全面的介绍,包括键命令、字符串命令、哈希表命令、列表命令、集合及有序集合命令、地理位置相关的GEO命令、统计相关的HyperLogLog命令。第三部分,主要介绍了Redis6的一些特性及使用,包括事务、持久化、主从复制以及集群等。 -
用Python高效操作Excel很简单张善春 著《用Python高效操作Excel很简单》由浅入深地介绍如何通过Python语言高效、快捷地操作Excel,从而引领读者高效编写各种能自动生成Excel文件的代码。本书精讲Python操作Excel涉及的大部分知识点,并辅以130多个典型代码示例和2个项目实战案例,从而帮助读者轻松上手并快速提高。《用Python高效操作Excel很简单》共11章,分为3篇。第1篇“基础知识”,首先介绍Python开发环境的搭建和配置,然后介绍基本数据类型、运算符、控制语句、循环语句、函数、模块和类等Python语言的基础知识。第2篇“进阶实操”,首先介绍Openpyxl库的基本操作,然后介绍如何使用Openpyxl制作各种常见的Excel图形,最后介绍Openpyxl与Pandas交互操作的相关知识。第3篇“项目实战”,首先基于前文介绍的基础知识,从数据采集、数据清洗和创建数据报表等方面展示一个自动生成财务报表项目的开发过程,然后对项目涉及的数据进一步进行处理,并对资产负债率、现金比率和企业盈利等多项指标进行分析,最后制作相应的图表文件。《用Python高效操作Excel很简单》适合有一定Excel基础而想进一步提高工作效率的人员阅读,尤其适合文秘、行政、人事、营销和财务等相关行业的从业人员阅读,也可供Python编程爱好者参考。 -
用户画像赵宏田内容简介这是一本能指导企业对全渠道(公域和私域)用户进行画像并实现自动化营销和运营的实战性著作,是作者多年大数据研发和用户画像经验的总结。本书将帮助企业提高数字化营销和运营的水平,通过用户画像提升业绩。本书核心内容围绕App、企业微信、公众号、小程序、抖音、小鹅通6大用户渠道展开,从系统集成、数据接入、产品功能、开发实现、应用场景等多角度详尽地阐述了如何进行全渠道的用户画像并构建数字化的客户数据平台,实现营销和运营的数字化和自动化。除此之外,本书还介绍了全渠道用户画像的整体构建思路,各种营销自动化工具的应用场景、技术实现方案、使用方法、工程案例以及在全渠道画像平台上的实现,以及私域引流和触点相关的内容。这本书既有渠道集成技术方案实现、用户画像功能开发、客户数据平台搭建等技术方面的内容,又有针对各渠道的产品功能、应用场景的营销和运营方面的玩法,适合企业的产品经理、数据分析师、营销和运营人员、数据开发人员、技术开发人员阅读。 -
ChatGPT原理与架构程戈 著内容简介这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度 好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程; 1章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。 -
数据质量管理十步法[美]达内特·麦吉利夫雷(Danette McGilvray)本书是一部通过提供一套易于遵守及操作的方法论来实现高质量数据管理的实践指南。内容全面、详细,并有许多实用的建议和模板,第1版推出后,已成为全球信息质量实践者的书籍,甚至已成为美国阿肯色大学信息质量研究生项目的教科书。本书共7章,内容包括数据质量和依赖于数据的世界、数据质量实践、关键概念、十步法流程、设计项目结构、其他技巧和工具,以及写在最后的话。作者将信息质量的概念框架与改善信息质量的技术、工具、操作指南相结合,提出并详细描述了获取高质量数据和可信信息的十步法。作为本书的最新改版,作者进一步阐明并更新了流程步骤和支持模板,整合了一些有价值的示例和案例,说明了近些年技术和数据生产的演变。本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和进阶用书,还可作为数据治理、信息技术、数据分析等领域人员的参考用书,也适合任何试图找到完善、实用且有效的书面建议来实现高质量数据的团队或个人。 -
从零开始学Power BI商业数据分析刘鑫《从零开始学Power BI商业数据分析(视频教学版)》从Power BI的基础知识讲起,然后逐步深入Power BI的进阶提升知识,最后配合项目实战案例,展示如何使用Power BI进行数据清洗、数据统计和数据可视化等相关操作,从而帮助零基础的数据分析人员快速上手。《从零开始学Power BI商业数据分析(视频教学版)》共10章,分为3篇。第1篇“基础知识”,主要介绍Power BI的下载和注册方法,以及相关组件的用法和数据导入方法,并详细介绍Power Query的基础知识。第2篇“进阶提升”,主要介绍数据建模、度量值、常用的度量值应用案例、可视化看板的制作和Power BI在线版等相关知识。第3篇“项目案例实战”,主要介绍如何用Power BI制作数据大屏、多页面交互式可视化看板和分析报告3个实战案例,展现数据清洗、数据统计和数据可视化的整个流程。《从零开始学Power BI商业数据分析(视频教学版)》通俗易懂,案例丰富,实用性强,适合Power BI的入门与进阶读者阅读,尤其是从事数据分析、商业分析、运营、人力管理和财务管理等经常与数据打交道的相关人员阅读,另外还适合相关培训机构的数据分析学员阅读。 -
SQL Server完全自学教程明日科技本书为SQL Server入门到提高图书,共17章,主要内容包括数据库基础、SQL Server数据库的安装与配置、创建和管理数据库、数据表操作、视图操作、SQL的基础知识、数据的查询、索引与数据完整性、流程控制、用户自定义函数、存储过程的使用、触发器的使用、游标的使用、SQL Server高级开发、SQL Server安全管理、SQL Server维护管理,最后讲解了学生成绩管理系统项目。本书每章内容都与实例紧密结合,有助于读者理解知识、应用知识,达到学以致用的目的。本书附有配套资源,包括本书所有实例的源码及教学视频。其中,源码全部经过精心测试,能够在Windows XP、Windows 7、Windows 8、Windows 10系统中编译和运行。本书可作为应用型本科计算机专业、高职软件技术专业及其他相关专业的教材,同时也适合初级数据库开发人员参考使用。 -
云数据安全关键技术田俊峰本书在简述云计算、大数据概念及密码学相关技术的基础上,主要介绍作者在数据持有性证明、数据确定性删除、云存储数据的一致性、抵抗同驻攻击、虚拟机迁移方面的研究成果。主要包括:可撤销的无证书数据持有性证明方案、关联标签的云数据完整性验证方案、多方参与的高效撤销组成员审计方案、基于属性基加密的高效确定性删除方案、面向优化数据中心结构的一致性协议设计、面向数据中心安全的一致性协议、基于 Shamir 的虚拟机放置策略、存储开销的抵御同驻攻击的数据分块加密备份方案、基于哈希图技术的跨数据中心虚拟机动态迁移方案等。 -
人工智能影响经济增长的多渠道效应研究黄志本书按照“总-分-总”的结构谋篇布局,深入探析了人工智能对经济增长的影响效应。总论部分在系统梳理相关文献、详细阐述理论基础以及清晰刻画人工智能影响经济增长的典型事实基础上,探析了人工智能在向经济社会渗透过程中表现出的四大经济效应,并对影响经济增长的三大主要因素(劳动、资本和生产技术)进行分析。在此基础上,通过分析人工智能四大经济效应作用于劳动、资本和生产技术对经济增长的影响效应,提出由劳动渠道、资本渠道和生产率渠道三条渠道构成的人工智能影响经济增长的总体分析框架。分论部分将理论分析和实证检验相结合逐一探讨了人工智能影响经济增长的劳动渠道、资本渠道和生产率渠道。此外,由于数据不可得,无法通过实证分析的方式来识别人工智能对长期经济增长的影响,因此,基于理论层面,进一步探讨了人工智能对长期经济增长以及未来南北差距产生影响的作用机理。 对论文的研究结论进行总结,并就中国人工智能发展提出了政策建议。
