书籍详情

深度学习处理结构化数据实战

深度学习处理结构化数据实战

作者:[加] 马克·瑞安(Mark Ryan) 著,史跃东 译

出版社:清华大学出版社

出版时间:2022-01-01

ISBN:9787302591290

定价:¥79.80

购买这本书可以去
内容简介
  告诉你一个不太光彩的秘密:在大多数数据科学项目中,有一半的时间都花在清理和准备数据上了。但还有更好的方法:针对表格数据和关系数据库进行优化的 深度学习技术,无需密集的特性工程,就能提供洞察和分析。学习使用少量的数据过滤、验证和清洗,就能解锁深度学习性能的技能。 《深度学习处理结构化数据实战》传授面向表格数据和关系数据库的强大数据分析技术。该书从多伦多公交系统的数据集出发,带你领略用深度学习处理表格化数据的简易性和便捷性,并教你解决在生产环境中部署模型和监控模型性能等关键问题。主要内容何时何地使用深度学习技术Keras深度学习模型的架构训练、部署以及维护模型量化评估性能
作者简介
  Mark Ryan在关系数据库和机器学习领域拥有20年的技术团队领导经验,他是谷歌在加拿大基奇纳市的经理。Mark Ryan热衷于分享机器学习的好处,对深度学习及其在结构化表格数据中释放额外价值的潜力感兴趣。
目录
第1章 为何要使用结构化数据进行深度学习
1.1 深度学习概述
1.2 深度学习的优缺点
1.3 深度学习软件栈概述
1.4 结构化数据与非结构化数据
1.5 反对使用结构化数据进行深度学习的相关意见
1.6 为何要研究基于结构化数据的深度学习问题?
1.7 本书附带的代码概述
1.8 你应该知道的内容
1.9 本章小结
第2章 示例问题和Pandas数据帧简介
2.1 深度学习开发环境选项
2.2 探索Pandas的代码
2.3 Python中的Pandas数据帧
2.4 将CSV文件提取到Pandas数据帧中
2.5 使用Pandas来完成SQL操作
2.6 主示例:预测有轨电车的延误情况
2.7 为何真实世界的数据集对于掌握深度学习至关重要
2.8 输入数据集的格式和范围
2.9 目的地:端到端的解决方案
2.10 有关解决方案代码的更多细节
2.11 开发环境:普通环境与深度学习专用环境
2.12 深入研究反对深度学习的意见
2.13 深度学习是如何变得更易于使用的
2.14 训练深度学习模型初试
2.15 本章小结
第3章 准备数据1:探索及清理数据
3.1 探索及清理数据的代码
3.2 在Python中使用配置文件
3.3 将XLS文件提取到Pandas数据帧中
3.4 使用pickle将Pandas数据帧从一个会话保存到另一个会话中
3.5 探索数据
3.6 将数据分为连续型、分类型以及文本型
3.7 清理数据集中存在的问题:数据丢失、错误以及猜测
3.8 确定深度学习需要多少数据
3.9 本章小结
第4章 准备数据2:转换数据
4.1 准备及转换数据的代码
4.2 处理不正确的数值:路线
4.3 为何只能用单个替代值来换掉所有错误的值?
4.4 处理不正确的值:车辆
4.5 处理不一致的值:位置
4.6 去向远方:位置
4.7 处理类型不匹配问题
4.8 处理依然包含错误数据的行
4.9 创建派生列
4.10 准备非数值型数据来训练深度学习模型
……
第5章 准备并构建模型
第6章 模型训练与实验
第7章 对已训练的模型进行更多实验
第8章 模型部署
第9章 建议的后继步骤
附录 使用Google协作
实验室(Google Colaboratory)
猜您喜欢

读书导航