书籍详情
计算机视觉应用构建:OpenCV与TensorFlow实例
作者:(美)沙姆沙德·安萨里(Shamshad Ansari)
出版社:机械工业出版社
出版时间:2022-09-01
ISBN:9787111708766
定价:¥99.00
购买这本书可以去
内容简介
本书首先介绍了图像处理基础知识、构建计算机视觉系统、深度学习与人工神经网络,然后重点阐述了深度学习用于图像识别及目标检测。之后,本书通过多个案例来介绍深度学习在计算机视觉方面的应用,同时探讨了云上计算机视觉建模。特别地,本书通过设问及循序渐进的学习目标,可以让读者深刻领会利用深度学习技术解决计算机视觉问题。
作者简介
作者简介 沙姆沙德?安萨里(Shamshad Ansari)是人工智能自动化公司Accure的创始人、总裁兼首席执行官。他比较擅长计算机视觉、机器学习、人工智能、认知科学、自然语言处理和大数据等技术,设计并开发了自动化AI解决方案开发平台Momentum。同时,他还是一名发明家,在人工智能和计算认知领域拥有4项美国专利。 沙姆沙德?安萨里曾担任IBM的高级软件工程师、Orbit Solutions的工程副总裁,以及Apixio的首席架构师和工程总监。
目录
译者序
前言
致谢
第1章 前提条件和软件安装 1
1.1 Python和PIP 1
1.2 virtualenv 3
1.3 TensorFlow 4
1.4 PyCharm IDE 4
1.5 OpenCV 5
1.6 附加库 6
第2章 图像和视频处理的核心概念 7
2.1 图像处理 7
2.2 图像基础 7
2.3 像素 8
2.4 坐标系 8
2.5 操作图像的Python和OpenCV代码 10
2.6 画图 13
2.7 总结 18
第3章 图像处理技术 19
3.1 图像转换 19
3.2 图像算术运算与位运算 28
3.3 掩码 36
3.4 通道分割与合并 38
3.5 利用平滑处理和模糊处理降噪 40
3.6 阈值二值化 46
3.7 梯度和边缘检测 52
3.8 轮廓 56
3.9 总结 58
第4章 构建基于机器学习的计算机视觉系统 59
4.1 图像处理流水线 59
4.2 特征提取 60
4.3 特征选择 79
4.4 模型训练 80
4.5 模型部署 82
4.6 总结 84
第5章 深度学习与人工神经网络 85
5.1 人工神经网络 85
5.2 TensorFlow 102
5.3 第一个使用深度学习的计算机视觉模型:手写数字分类 104
5.4 模型评估 110
5.5 超参数 113
5.6 保存模型和恢复模型 117
5.7 卷积神经网络 121
5.8 总结 135
第6章 深度学习用于目标检测 136
6.1 目标检测 136
6.2 交并比 137
6.3 R-CNN 138
6.4 Fast R-CNN 139
6.5 Faster R-CNN 140
6.6 Mask R-CNN 141
6.7 单发多盒检测 144
6.8 YOLO 148
6.9 YOLO的局限性 150
6.10 目标检测算法的比较 153
6.11 利用TensorFlow训练目标检测模型 155
6.12 利用训练的模型检测目标 171
6.13 用于目标检测的YOLOv3模型训练 182
6.14 利用训练的YOLOv3模型检测目标 190
6.15 总结 194
第7章 实例:视频中的目标跟踪 195
7.1 准备工作环境 196
7.2 读取视频流 197
7.3 加载目标检测模型 199
7.4 检测视频帧中的目标 199
7.5 利用dHash算法为目标创建唯一标识 201
7.6 用汉明距离法计算图像相似度 202
7.7 目标跟踪 202
7.8 在Web浏览器中显示实时视频流 204
7.9 整合 207
7.10 总结 214
第8章 实例:人脸识别 215
8.1 FaceNet及其架构 215
8.2 人脸识别模型的训练 220
8.3 实时人脸识别系统的开发 226
8.4 总结 230
第9章 工业应用:工业制造中的实时缺陷检测 231
9.1 实时表面缺陷检测系统 231
9.2 图像注释 244
9.3 总结 248
第10章 云上计算机视觉建模 249
10.1 TensorFlow分布式训练 250
10.2 TensorFlow分布策略 251
10.3 TF_CONFIG:TensorFlow集群配置 255
10.4 使用参数服务器的分布式训练示例代码 256
10.5 在云上执行分布式训练的步骤 259
10.6 基于谷歌云的分布式训练 260
10.7 基于Azure的分布式训练 267
10.8 基于AWS的分布式训练 275
10.9 总结 285
前言
致谢
第1章 前提条件和软件安装 1
1.1 Python和PIP 1
1.2 virtualenv 3
1.3 TensorFlow 4
1.4 PyCharm IDE 4
1.5 OpenCV 5
1.6 附加库 6
第2章 图像和视频处理的核心概念 7
2.1 图像处理 7
2.2 图像基础 7
2.3 像素 8
2.4 坐标系 8
2.5 操作图像的Python和OpenCV代码 10
2.6 画图 13
2.7 总结 18
第3章 图像处理技术 19
3.1 图像转换 19
3.2 图像算术运算与位运算 28
3.3 掩码 36
3.4 通道分割与合并 38
3.5 利用平滑处理和模糊处理降噪 40
3.6 阈值二值化 46
3.7 梯度和边缘检测 52
3.8 轮廓 56
3.9 总结 58
第4章 构建基于机器学习的计算机视觉系统 59
4.1 图像处理流水线 59
4.2 特征提取 60
4.3 特征选择 79
4.4 模型训练 80
4.5 模型部署 82
4.6 总结 84
第5章 深度学习与人工神经网络 85
5.1 人工神经网络 85
5.2 TensorFlow 102
5.3 第一个使用深度学习的计算机视觉模型:手写数字分类 104
5.4 模型评估 110
5.5 超参数 113
5.6 保存模型和恢复模型 117
5.7 卷积神经网络 121
5.8 总结 135
第6章 深度学习用于目标检测 136
6.1 目标检测 136
6.2 交并比 137
6.3 R-CNN 138
6.4 Fast R-CNN 139
6.5 Faster R-CNN 140
6.6 Mask R-CNN 141
6.7 单发多盒检测 144
6.8 YOLO 148
6.9 YOLO的局限性 150
6.10 目标检测算法的比较 153
6.11 利用TensorFlow训练目标检测模型 155
6.12 利用训练的模型检测目标 171
6.13 用于目标检测的YOLOv3模型训练 182
6.14 利用训练的YOLOv3模型检测目标 190
6.15 总结 194
第7章 实例:视频中的目标跟踪 195
7.1 准备工作环境 196
7.2 读取视频流 197
7.3 加载目标检测模型 199
7.4 检测视频帧中的目标 199
7.5 利用dHash算法为目标创建唯一标识 201
7.6 用汉明距离法计算图像相似度 202
7.7 目标跟踪 202
7.8 在Web浏览器中显示实时视频流 204
7.9 整合 207
7.10 总结 214
第8章 实例:人脸识别 215
8.1 FaceNet及其架构 215
8.2 人脸识别模型的训练 220
8.3 实时人脸识别系统的开发 226
8.4 总结 230
第9章 工业应用:工业制造中的实时缺陷检测 231
9.1 实时表面缺陷检测系统 231
9.2 图像注释 244
9.3 总结 248
第10章 云上计算机视觉建模 249
10.1 TensorFlow分布式训练 250
10.2 TensorFlow分布策略 251
10.3 TF_CONFIG:TensorFlow集群配置 255
10.4 使用参数服务器的分布式训练示例代码 256
10.5 在云上执行分布式训练的步骤 259
10.6 基于谷歌云的分布式训练 260
10.7 基于Azure的分布式训练 267
10.8 基于AWS的分布式训练 275
10.9 总结 285
猜您喜欢