书籍详情

计算机视觉入门到实践

计算机视觉入门到实践

作者:[印] 阿布辛纳夫·达和奇(Abhinav Dadhich) 著,连晓峰 译

出版社:机械工业出版社

出版时间:2020-12-01

ISBN:9787111662297

定价:¥69.00

购买这本书可以去
内容简介
  本书是你了解计算机视觉的一站式指南。利用Python、TensorFlow、Keras和OpenCV的功能执行图像处理、对象检测、特征检测等项目。通过对卷积神经网络的介绍,你将学习如何使用Keras构建深度神经网络,以及如何使用它对Fashion-MNIST数据集进行分类。关于对象检测,你将学习到使用TensorFlow实现简单的面部检测器,以及复杂的基于深度学习的对象检测器(例如Faster R-CNN和SSD)的工作原理。你也将学会使用FCN模型进行语义分割,并使用DeepSORT跟踪对象。不仅如此,你还将学习到在标准数据集上使用视觉SLAM(vSLAM)技术,例如ORB-SLAM。 本书适合希望以*实际的方式理解和实现与计算机视觉和图像处理相关的各种任务的机器学习从业人员和深度学习学习者阅读。
作者简介
  关于作者 Abhinav Dadhich是东京ABEJA公司的一名深度学习方面的研究以及应用开发人员。其专注于为图像分类、目标检测、分割等计算机视觉应用设计深度学习模型,并且目前将全部精力都倾注在理解和复现人类视觉系统的研究与实现上。而此前,其一直致力于三维地图构建和机器人导航领域。Dadhich毕业于印度IIT Jodhpur学院,获得电子工程学士学位,并在日本NAIST大学获得信息科学硕士学位。在GitHub专栏为多个主题提供注释和代码。关于译者 连晓峰,博士,北京理工大学模式识别与智能系统专业毕业。现任北京工商大学副教授,研究生导师。中国自动化学会机器人竞赛工作委员会委员、中国教育发展战略学会人工智能与机器人教育专业委员会理事、中国人工智能学会高级会员、中国电子学会高级会员等。目前从事复杂系统建模与优化控制、智能机器人、模式识别与智能系统、智能感知与机器学习、工业先进控制等教学与科学研究工作。
目录
第1章 计算机视觉快速入门
1.1 什么是计算机视觉
1.2 计算机视觉无处不在
1.3 入门
1.3.1 读取图像
1.3.2 图像颜色转换
1.4 计算机视觉研究的相关会议
1.5 小结
第2章 库、开发平台和数据集
2.1 库及其安装方法
2.1.1 安装Anaconda
2.1.2 安装OpenCV
2.1.3 用于深度学习的TensorFlow
2.1.4 用于深度学习的Keras
2.2 数据集
2.2.1 ImageNet
2.2.2 MNIST
2.2.3 CIFAR-10
2.2.4 Pascal VOC
2.2.5 MSCOCO
2.2.6 TUM RGB-D数据集
2.3 小结
参考文献
第3章 OpenCV中的图像滤波和变换
3.1 数据集和库
3.2 图像处理
3.3 滤波器概述
3.3.1 线性滤波器
3.3.2 非线性滤波器
3.3.3 图像梯度
3.4 图像变换
3.4.1 平移
3.4.2 旋转
3.4.3 仿射变换
3.5 图像金字塔
3.6 小结
第4章 什么是特征
4.1 特征用例
4.1.1 数据集和库
4.1.2 为何特征如此重要
4.2 Harris角点检测
4.2.1 FAST特征
4.2.2 ORB特征
4.2.3 黑箱特征
4.2.4  应用—在图像中检测目标对象
4.2.5 应用—是否相似
4.3 小结
参考文献
第5章 卷积神经网络
5.1 数据集和库
5.2 神经网络简介
5.2.1 一个简单的神经网络
5.3 重温卷积运算
5.4 卷积神经网络
5.4.1 卷积层
5.4.2 激活层
5.4.3 池化层
5.4.4 全连接层
5.4.5 批归一化
5.4.6 退出
5.5 CNN 实践
5.5.1 Fashion-MNIST 分类器训练代码
5.5.2 CNN 分析
5.5.3 迁移学习
5.6 小结
第6章 基于特征的目标检测
6.1 目标检测概述
6.2 目标检测挑战
6.3 数据集和库
6.4 目标检测方法
6.4.1 基于深度学习的目标检测
6.5 小结
参考文献
第7章 分割和跟踪
7.1 数据集和库
7.2 分割
7.2.1 分割挑战
7.2.2 用于分割的CNN
7.2.3 FCN的实现
7.3 跟踪
7.3.1 跟踪挑战
7.3.2 目标跟踪方法
7.4 小结
参考文献
第8章 三维计算机视觉
8.1 数据集和库
8.2 应用
8.3 成像原理
8.4 图像对齐
8.5 视觉里程计
8.6 视觉SLAM
8.7 小结
参考文献
第9章 计算机视觉中的数学
9.1 数据集和库
9.2 线性代数
9.2.1 向量
9.2.2 矩阵
9.2.3 Hessian矩阵
9.2.4 奇异值分解
9.3 概率论简述
9.3.1 什么是随机变量
9.3.2 期望
9.3.3 方差
9.3.4 概率分布
9.3.5 联合分布
9.3.6 边缘分布
9.3.7 条件分布
9.3.8 贝叶斯定理
9.4 小结
第10章 计算机视觉中的机器学习
10.1 什么是机器学习
10.2 机器学习技术分类
10.2.1 监督式学习
10.2.2 无监督式学习
10.3 维度灾难
10.4 机器学习的滚球视角
10.5 常用工具
10.5.1 预处理
10.5.2 后处理
10.6 评估
10.6.1 准确率
10.6.2 召回率
10.6.3 F-分数
10.7 小结
猜您喜欢

读书导航