书籍详情
深度学习与图像分析:基础与应用
作者:李松斌,刘鹏 著
出版社:科学出版社
出版时间:2020-12-01
ISBN:9787030670632
定价:¥149.00
购买这本书可以去
内容简介
《深度学习与图像分析——基础与应用》分基础和应用两个部分深入介绍了深度学习应用于图像分析的基本概念、方法和技术。在基础部分,第1章介绍了神经网络与深度学习基础知识,在此基础上,第2、3、4、5章分别深入讨论了近年来深度学习在图像分类、对象检测、语义分割及图像生成等应用领域的相关技术和方法。在每个应用领域下,对相关技术和方法的核心思想与进化历程及发展脉络进行了详细梳理和分析阐述,并对每个应用主题下的方法的性能进行了深入的比较与评价。在应用部分,第6、7、8、9、10章分别介绍了《深度学习与图像分析——基础与应用》团队应用深度学习技术进行车道线检测、火灾检测、视频隐写分析、病虫害检测以及虚假图像识别的方法和技术,在每个章节中详细阐述了所提出方法的背景及原理、模型设计与实现,并对其性能进行了详细的实验与分析。
作者简介
暂缺《深度学习与图像分析:基础与应用》作者简介
目录
目录
前言
第一部分 基础部分
第1章 神经网络与深度学习基础知识 3
1.1 神经元模型与感知机 3
1.2 从感知机到神经网络—激活函数的引入 6
1.3 从神经网络到深度学习网络 12
1.4 深度学习网络示例 16
1.5 深度学习网络训练过程 20
1.5.1 数据集的准备 20
1.5.2 常用损失函数的介绍与比较 21
1.5.3 基于数值微分计算损失函数关于网络参数的梯度 23
1.5.4 基于误差反向传播算法计算损失函数关于网络参数的梯度 25
1.5.5 基于随机梯度下降算法实现网络参数更新 29
1.5.6 基于动量法实现网络参数更新 30
1.5.7 基于自适应梯度算法实现网络参数更新 31
1.5.8 基于自适应矩估计算法实现网络参数更新 32
1.6 深度学习常用工具介绍与比较 32
1.6.1 TensorFlow框架介绍与实例 32
1.6.2 Caffe框架介绍与实例 35
1.6.3 MXNet框架介绍与实例 38
1.6.4 Keras框架介绍与实例 39
1.6.5 PyTorch框架介绍与实例 40
1.6.6 各框架性能比较与评价 41
1.7 本章小结 41
参考文献 42
第2章 基于深度学习的图像分类算法核心思想与算法进化 44
2.1 图像分类基础概念与原理 44
2.2 基于深度学习的图像分类算法的诞生与发展 46
2.2.1 基于深度学习的图像分类算法的诞生—LeNet 546
2.2.2 开创基于深度学习图像分类算法的新局面—AlexNet 47
2.2.3 基于小卷积核的图像分类算法—VGGNet 49
2.2.4 基于*优局部稀疏结构的图像分类算法—Inception系列 50
2.2.5 基于恒等映射残差单元的图像分类算法—ResNet 54
2.2.6 基于聚合转换残差单元的图像分类算法—ResNeXt 55
2.2.7 基于多层密集连接的图像分类算法—DenseNet 57
2.2.8 基于特征通道重标定的图像分类算法—SENet 59
2.2.9 基于通道压缩与扩展的图像分类算法—SqueezeNet 61
2.2.10 基于深度可分离卷积的图像分类算法—MobileNet 63
2.2.11 基于逐点群卷积与通道混洗的图像分类算法—ShuffleNet 65
2.2.12 基于神经架构自动搜索的图像分类算法—NASNet 67
2.3 算法评价与性能比较 68
2.3.1 常用数据集介绍 69
2.3.2 评价指标 69
2.3.3 性能比较与算法评价 70
2.4 本章小结 70
参考文献 71
第3章 基于深度学习的目标检测算法核心思想及优化过程 73
3.1 目标检测基础概念与原理 73
3.2 基于深度学习的目标检测算法的提出与优化 74
3.2.1 首个基于卷积神经网络的目标检测算法—R-CNN 75
3.2.2 基于空间金字塔池化的目标检测算法—SPPNet 76
3.2.3 基于R-CNN和SPPNet改进的目标检测算法—FastR-CNN 78
3.2.4 基于卷积提取候选区域的R-CNN—FasterR-CNN 79
3.2.5 基于语义分割和FasterR-CNN的目标检测网络—MaskR-CNN 82
3.2.6 一步式目标检测算法的提出—YOLO系列 84
3.2.7 基于特征金字塔的目标检测算法—FPN 91
3.2.8 基于单发细化目标的检测算法—RefineDet 92
3.2.9 基于主干架构搜索的目标检测算法—DetNAS 94
3.2.10 基于神经架构搜索的目标检测算法—NAS-FPN 96
3.3 性能比较 99
3.4 本章小结 106
参考文献 106
第4章 基于深度学习的语义分割算法的本质与革新 109
4.1 语义分割基础概念与原理 109
4.2 基于深度学习的语义分割算法的提出与改进 110
4.2.1 首个基于深度学习的语义分割算法—FCN 111
4.2.2 基于深度编解码结构的语义分割算法—SegNet 112
4.2.3 基于空洞卷积的语义分割算法—dilate convolution 114
4.2.4 基于金字塔池化聚合多尺度信息的语义分割算法—PSPNet 115
4.2.5 基于卷积神经网络与条件随机场的语义分割算法—DeepLab-v1 117
4.2.6 基于空洞空间金字塔池化与条件随机场的语义分割算法—DeepLab-v 2119
4.2.7 基于级联空洞卷积与并行多空洞率金字塔池化的语义分割算法—DeepLab-v 3120
4.2.8 基于深度可分离卷积与并行多空洞率金字塔池化的语义分割算法—DeepLab-v3+ 121
4.2.9 基于多路径优化的语义分割算法—RefineNet 123
4.2.10 基于注意力优化与特征融合的语义分割算法—BiSeNet 125
4.2.11 基于增强特征融合的语义分割算法—ExFuse 126
4.2.12 基于双路注意力机制的语义分割算法—DANet 129
4.3 算法评价与性能比较 131
4.3.1 常用数据集介绍 131
4.3.2 评价指标 132
4.3.3 性能比较与算法评价 133
4.4 本章小结 133
参考文献 134
第5章 基于深度学习的图像生成算法原理及发展 136
5.1 图像生成基础 136
5.2 基于深度学习的图像生成算法的提出与发展 138
5.2.1 生成对抗网络的提出—GAN 138
5.2.2 基于条件约束的生成对抗网络—CGAN 140
5.2.3 基于深度卷积的生成对抗网络—DCGAN 141
5.2.4 基于*小二乘法的生成对抗网络—LSGAN 142
5.2.5 基于Wasserstein距离的生成对抗网络—WGAN 142
5.2.6 从能量的角度理解GAN—EBGAN 143
5.2.7 实现图像到图像翻译的生成对抗网络—PIX 2PIX 144
5.2.8 基于两领域图像风格转换的生成对抗网络—CycleGAN 145
5.2.9 基于多领域图像生成的生成对抗网络—StarGAN 146
5.2.10 基于神经架构搜索的生成对抗网络—AutoGAN 148
5.3 性能比较 150
5.4 本章小结 155
参考文献 156
第二部分 应用部分
第6章 基于非对称卷积块架构增强和通道特征选择机制的车道线检测算法 159
6.1 引言 159
6.2 相关研究现状 160
6.2.1 基于深度学习的车道线检测 160
6.2.2 注意力机制 161
6.2.3 生成对抗网络 161
6.3 非对称卷积与通道特征选择机制网络模型 162
6.3.1 卷积下采样单元 162
6.3.2 转置卷积上采样单元 163
6.3.3 非对称卷积模型 164
6.3.4 双通道注意力机制 165
6.3.5 通道选择机制 166
6.4 网络结构 167
6.5 模型实现 169
6.5.1 数据加载 169
6.5.2 模型的构建 170
6.5.3 训练和测试 175
6.6 性能分析与讨论 177
6.6.1 数据准备 177
6.6.2 模型训练 178
6.6.3 结果与分析 178
6.7 本章小结 181
参考文献 181
第7章 基于多尺度特征提取和重用及特征重标定的高效火灾检测方法 184
7.1 引言 184
7.2 相关研究现状 185
7.3 高效的火灾检测模型 187
7.3.1 多尺度特征提取 188
7.3.2 多尺度特征重用 189
7.3.3 特征重标定 190
7.3.4 特征分类 191
7.3.5 模型设计过程 191
7.4 模型实现 193
7.4.1 数据加载 193
7.4.2 模型定义 195
7.4.3 模型训练 198
7.5 性能分析与讨论 200
7.5.1 数据准备 200
7.5.2 模型训练 201
7.5.3 实验结果与分析 201
7.6 本章小结 205
参考文献 205
第8章 基于噪声残差卷积神经网络的运动矢量和帧内预测模式调制信息隐藏通用检测方法 209
8.1 引言 209
8.2 相关研究现状 210
8.3 卷积神经网络用于信息隐藏检测的合理性 211
8.4 噪声残差卷积神经网络模型 212
8.4.1 残差卷积层 214
8.4.2 卷积层 215
8.4.3 激活函数 216
8.4.4 隐写残差单元 217
8.4.5 池化层 218
8.4.6 全连接层 219
8.4.7 批量标准化 219
8.5 模型实现 219
8.5.1 数据加载 219
8.5.2 模型定义 220
8.5.3 模型训练 224
8.6 性能分析与讨论 226
8.6.1 数据准备 226
8.6.2 模型训练 227
8.6.3 结果与分析 227
8.7 本章小结 233
参考文献 234
第9章 基于多尺度特征融合和注意力机制的病虫害检测 239
9.1 引言 239
9.2 相关研究现状 240
9.2.1 病虫害识别与检测 240
9.2.2 语义分割技术 241
9.3 基于多尺度特征融合及注意力机制的病虫害检测模型 242
9.3.1 编码器 243
9.3.2 解码器 247
9.4 模型实现 250
9.4.1 数据加载 250
9.4.2 模型定义 251
9.4.3 模型训练 256
9.5 性能分析与讨论 257
9.5.1 数据准备 257
9.5.2 模型训练 258
9.5.3 评价指标 259
9.5.4 烧蚀实验结果与分析 259
9.5.5 与现有语义分割算法的比较 262
9.6 本章小结 263
参考文献 263
第10章 基于深度学习的GAN生成虚假图像检测方法 267
10.1 引言 267
10.2 相关研究现状 268
10.3 基于宽度拓展的虚假图像检测卷积神经网络模型 269
10.3.1 网络宽度拓展 271
10.3.2 深层残差特征学习 273
10.4 模型实现 274
10.4.1 数据加载 274
10.4.2 模型定义 275
10.4.3 模型训练 281
10.5 性能分析与讨论 282
10.5.1 数据准备 282
10.5.2 模型训练 284
10.5.3 评价指标 284
10.5.4 烧蚀实验结果与分析 284
10.5.5 与现有方法的比较结果 286
10.6 本章小结 286
参考文献 287
前言
第一部分 基础部分
第1章 神经网络与深度学习基础知识 3
1.1 神经元模型与感知机 3
1.2 从感知机到神经网络—激活函数的引入 6
1.3 从神经网络到深度学习网络 12
1.4 深度学习网络示例 16
1.5 深度学习网络训练过程 20
1.5.1 数据集的准备 20
1.5.2 常用损失函数的介绍与比较 21
1.5.3 基于数值微分计算损失函数关于网络参数的梯度 23
1.5.4 基于误差反向传播算法计算损失函数关于网络参数的梯度 25
1.5.5 基于随机梯度下降算法实现网络参数更新 29
1.5.6 基于动量法实现网络参数更新 30
1.5.7 基于自适应梯度算法实现网络参数更新 31
1.5.8 基于自适应矩估计算法实现网络参数更新 32
1.6 深度学习常用工具介绍与比较 32
1.6.1 TensorFlow框架介绍与实例 32
1.6.2 Caffe框架介绍与实例 35
1.6.3 MXNet框架介绍与实例 38
1.6.4 Keras框架介绍与实例 39
1.6.5 PyTorch框架介绍与实例 40
1.6.6 各框架性能比较与评价 41
1.7 本章小结 41
参考文献 42
第2章 基于深度学习的图像分类算法核心思想与算法进化 44
2.1 图像分类基础概念与原理 44
2.2 基于深度学习的图像分类算法的诞生与发展 46
2.2.1 基于深度学习的图像分类算法的诞生—LeNet 546
2.2.2 开创基于深度学习图像分类算法的新局面—AlexNet 47
2.2.3 基于小卷积核的图像分类算法—VGGNet 49
2.2.4 基于*优局部稀疏结构的图像分类算法—Inception系列 50
2.2.5 基于恒等映射残差单元的图像分类算法—ResNet 54
2.2.6 基于聚合转换残差单元的图像分类算法—ResNeXt 55
2.2.7 基于多层密集连接的图像分类算法—DenseNet 57
2.2.8 基于特征通道重标定的图像分类算法—SENet 59
2.2.9 基于通道压缩与扩展的图像分类算法—SqueezeNet 61
2.2.10 基于深度可分离卷积的图像分类算法—MobileNet 63
2.2.11 基于逐点群卷积与通道混洗的图像分类算法—ShuffleNet 65
2.2.12 基于神经架构自动搜索的图像分类算法—NASNet 67
2.3 算法评价与性能比较 68
2.3.1 常用数据集介绍 69
2.3.2 评价指标 69
2.3.3 性能比较与算法评价 70
2.4 本章小结 70
参考文献 71
第3章 基于深度学习的目标检测算法核心思想及优化过程 73
3.1 目标检测基础概念与原理 73
3.2 基于深度学习的目标检测算法的提出与优化 74
3.2.1 首个基于卷积神经网络的目标检测算法—R-CNN 75
3.2.2 基于空间金字塔池化的目标检测算法—SPPNet 76
3.2.3 基于R-CNN和SPPNet改进的目标检测算法—FastR-CNN 78
3.2.4 基于卷积提取候选区域的R-CNN—FasterR-CNN 79
3.2.5 基于语义分割和FasterR-CNN的目标检测网络—MaskR-CNN 82
3.2.6 一步式目标检测算法的提出—YOLO系列 84
3.2.7 基于特征金字塔的目标检测算法—FPN 91
3.2.8 基于单发细化目标的检测算法—RefineDet 92
3.2.9 基于主干架构搜索的目标检测算法—DetNAS 94
3.2.10 基于神经架构搜索的目标检测算法—NAS-FPN 96
3.3 性能比较 99
3.4 本章小结 106
参考文献 106
第4章 基于深度学习的语义分割算法的本质与革新 109
4.1 语义分割基础概念与原理 109
4.2 基于深度学习的语义分割算法的提出与改进 110
4.2.1 首个基于深度学习的语义分割算法—FCN 111
4.2.2 基于深度编解码结构的语义分割算法—SegNet 112
4.2.3 基于空洞卷积的语义分割算法—dilate convolution 114
4.2.4 基于金字塔池化聚合多尺度信息的语义分割算法—PSPNet 115
4.2.5 基于卷积神经网络与条件随机场的语义分割算法—DeepLab-v1 117
4.2.6 基于空洞空间金字塔池化与条件随机场的语义分割算法—DeepLab-v 2119
4.2.7 基于级联空洞卷积与并行多空洞率金字塔池化的语义分割算法—DeepLab-v 3120
4.2.8 基于深度可分离卷积与并行多空洞率金字塔池化的语义分割算法—DeepLab-v3+ 121
4.2.9 基于多路径优化的语义分割算法—RefineNet 123
4.2.10 基于注意力优化与特征融合的语义分割算法—BiSeNet 125
4.2.11 基于增强特征融合的语义分割算法—ExFuse 126
4.2.12 基于双路注意力机制的语义分割算法—DANet 129
4.3 算法评价与性能比较 131
4.3.1 常用数据集介绍 131
4.3.2 评价指标 132
4.3.3 性能比较与算法评价 133
4.4 本章小结 133
参考文献 134
第5章 基于深度学习的图像生成算法原理及发展 136
5.1 图像生成基础 136
5.2 基于深度学习的图像生成算法的提出与发展 138
5.2.1 生成对抗网络的提出—GAN 138
5.2.2 基于条件约束的生成对抗网络—CGAN 140
5.2.3 基于深度卷积的生成对抗网络—DCGAN 141
5.2.4 基于*小二乘法的生成对抗网络—LSGAN 142
5.2.5 基于Wasserstein距离的生成对抗网络—WGAN 142
5.2.6 从能量的角度理解GAN—EBGAN 143
5.2.7 实现图像到图像翻译的生成对抗网络—PIX 2PIX 144
5.2.8 基于两领域图像风格转换的生成对抗网络—CycleGAN 145
5.2.9 基于多领域图像生成的生成对抗网络—StarGAN 146
5.2.10 基于神经架构搜索的生成对抗网络—AutoGAN 148
5.3 性能比较 150
5.4 本章小结 155
参考文献 156
第二部分 应用部分
第6章 基于非对称卷积块架构增强和通道特征选择机制的车道线检测算法 159
6.1 引言 159
6.2 相关研究现状 160
6.2.1 基于深度学习的车道线检测 160
6.2.2 注意力机制 161
6.2.3 生成对抗网络 161
6.3 非对称卷积与通道特征选择机制网络模型 162
6.3.1 卷积下采样单元 162
6.3.2 转置卷积上采样单元 163
6.3.3 非对称卷积模型 164
6.3.4 双通道注意力机制 165
6.3.5 通道选择机制 166
6.4 网络结构 167
6.5 模型实现 169
6.5.1 数据加载 169
6.5.2 模型的构建 170
6.5.3 训练和测试 175
6.6 性能分析与讨论 177
6.6.1 数据准备 177
6.6.2 模型训练 178
6.6.3 结果与分析 178
6.7 本章小结 181
参考文献 181
第7章 基于多尺度特征提取和重用及特征重标定的高效火灾检测方法 184
7.1 引言 184
7.2 相关研究现状 185
7.3 高效的火灾检测模型 187
7.3.1 多尺度特征提取 188
7.3.2 多尺度特征重用 189
7.3.3 特征重标定 190
7.3.4 特征分类 191
7.3.5 模型设计过程 191
7.4 模型实现 193
7.4.1 数据加载 193
7.4.2 模型定义 195
7.4.3 模型训练 198
7.5 性能分析与讨论 200
7.5.1 数据准备 200
7.5.2 模型训练 201
7.5.3 实验结果与分析 201
7.6 本章小结 205
参考文献 205
第8章 基于噪声残差卷积神经网络的运动矢量和帧内预测模式调制信息隐藏通用检测方法 209
8.1 引言 209
8.2 相关研究现状 210
8.3 卷积神经网络用于信息隐藏检测的合理性 211
8.4 噪声残差卷积神经网络模型 212
8.4.1 残差卷积层 214
8.4.2 卷积层 215
8.4.3 激活函数 216
8.4.4 隐写残差单元 217
8.4.5 池化层 218
8.4.6 全连接层 219
8.4.7 批量标准化 219
8.5 模型实现 219
8.5.1 数据加载 219
8.5.2 模型定义 220
8.5.3 模型训练 224
8.6 性能分析与讨论 226
8.6.1 数据准备 226
8.6.2 模型训练 227
8.6.3 结果与分析 227
8.7 本章小结 233
参考文献 234
第9章 基于多尺度特征融合和注意力机制的病虫害检测 239
9.1 引言 239
9.2 相关研究现状 240
9.2.1 病虫害识别与检测 240
9.2.2 语义分割技术 241
9.3 基于多尺度特征融合及注意力机制的病虫害检测模型 242
9.3.1 编码器 243
9.3.2 解码器 247
9.4 模型实现 250
9.4.1 数据加载 250
9.4.2 模型定义 251
9.4.3 模型训练 256
9.5 性能分析与讨论 257
9.5.1 数据准备 257
9.5.2 模型训练 258
9.5.3 评价指标 259
9.5.4 烧蚀实验结果与分析 259
9.5.5 与现有语义分割算法的比较 262
9.6 本章小结 263
参考文献 263
第10章 基于深度学习的GAN生成虚假图像检测方法 267
10.1 引言 267
10.2 相关研究现状 268
10.3 基于宽度拓展的虚假图像检测卷积神经网络模型 269
10.3.1 网络宽度拓展 271
10.3.2 深层残差特征学习 273
10.4 模型实现 274
10.4.1 数据加载 274
10.4.2 模型定义 275
10.4.3 模型训练 281
10.5 性能分析与讨论 282
10.5.1 数据准备 282
10.5.2 模型训练 284
10.5.3 评价指标 284
10.5.4 烧蚀实验结果与分析 284
10.5.5 与现有方法的比较结果 286
10.6 本章小结 286
参考文献 287
猜您喜欢