书籍详情

Python与R语言数据科学实践

Python与R语言数据科学实践

作者:[加拿大/意大利]里克·J.斯卡韦塔(Rick J. Scavetta)

出版社:人民邮电出版社

出版时间:2023-11-01

ISBN:9787115610713

定价:¥69.80

购买这本书可以去
内容简介
  本书从数据科学的角度,讲解了Python和R的语言特性以及各自的优缺点,介绍了包括包、框架和工作流在内的开源生态系统,分析了Python和R分别适用于哪些业务场景,并通过真实的案例演示如何在单个工作流中集成Python与R,使两种语言充分发挥优势,改善业务应用的效果。本书还提供了Python和R的对照翻译,帮助读者在两种语言间快速切换。本书适合数据科学领域有一定Python或R基础的开发人员阅读,能够帮助读者探索完成数据科学任务的新方法并改善应用效果。
作者简介
  里克·J.斯卡韦塔(RickJ.Scavetta)自2012年以来,一直担任着独立研讨会的培训师、自由职业数据科学家和机构联合创始人的角色。作为Scavetta Academy运营人员,与德国的主要研究机构也有着密切且经常性的往来。自2016年以来,他发布在DataCamp 上的在线课程已被超过200,000名学生学习,同时还为O'Reilly和Manning的高级数据科学课程做出了贡献。博扬·安格洛夫(Boyan Angelov)是一位数据科学战略家和顾问,在各种学术和行业环境中拥有十余年的经验,研究涵盖的主题包括生物信息学、临床试验、人力资源技术和管理咨询。他还是XAI领域开源科学项目的贡献者,并定期在各种学术会议和社区聚会上发言。
目录
前言 xiii
第I部分 探索新的语言
第 1章 概述 3
1.1 R的起源 3
1.2 Python的起源 4
1.3 语言战争的开端 5
1.4 数据科学主导权之战 6
1.5 合作与社区建设的融合 8
1.6 最后的想法 8


第II部分 两种编程语言I:新学习一门语言
第 2章 针对Python用户的R 13
2.1 启动和运行R 13
2.2 项目和第三方库 15
2.3 Tibbles的胜利 20
2.4 关于数据类型和数据探索 23
2.5 关于命名(内部) 25
2.6 列表 27
2.7 关于因子 29
2.8 如何查找 30
2.9 重复迭代 37
2.10 最后的想法 38

第3章 针对R用户的Python 40
3.1 版本和构建 41
3.2 标准工具 42
3.3 虚拟环境 46
3.4 安装第三方库 50
3.5 笔记本 52
3.6 从编程语言角度对比Python和R 53
3.7 导入数据集 55
3.8 检查数据 55
3.9 数据结构和描述性统计 57
3.10 数据结构:回归基础 58
3.11 索引和逻辑表达式 60
3.12 绘图 61
3.13 推理统计 61
3.14 最后的想法 62


第III部分 两种编程语言II:现代的环境
第4章 数据格式环境 65
4.1 外部第三方库与基础库 67
4.2 图像数据 69
4.3 文本数据 74
4.4 时间序列数据 77
4.4.1 基础R 77
4.4.2 Prophet第三方库 79
4.5 空间数据 80
4.6 最后的想法 82

第5章 工作流程环境 83
5.1 定义工作流程 83
5.2 探索式数据分析 85
5.2.1 统计可视化 85
5.2.2 交互可视化 88
5.3 机器学习 89
5.4 数据工程 93
5.5 报表 97
5.5.1 静态报表 97
5.5.2 互动式报表 98
5.6 最后的想法 101


第IV部分 两种编程语言III:学会协同
第6章 协同使用两种语言 105
6.1 虚拟的互操作性 105
6.2 互操作性 107
6.3 深入互操作性 112
6.3.1 在R Markdown文档中R和Python之间传递对象 112
6.3.2 在R Markdown文档中调用Python 113
6.3.3 使用来源命令调用Python 114
6.3.4 使用REPL调用Python 115
6.3.5 在交互式文档中使用动态输入调用Python 115
6.4 最后的想法 117

第7章 两种编程语言数据科学案例研究 118
7.1 24年188万场野火 118
7.2 设置和导入数据 121
7.3 EDA和数据可视化 122
7.4 机器学习 126
7.4.1 设置Python环境 126
7.4.2 特征工程 127
7.4.3 模型训练 128
7.5 推理和用户界面 129
7.6 最后的想法 131

附录 Python-R双语词典 133
第三方库管理 133
赋值运算符 134
类型 136
数学运算符 137
属性 137
关键字 138
函数和方法 138
编码风格和命名约定 139
数据存储对象类比 140
数据帧 142
逻辑表达式 145
索引 147

关于作者 152
关于封面 152
猜您喜欢

读书导航