书籍详情
计算机视觉:飞桨深度学习实战
作者:深度学习技术及应用国家工程研究中心 百度技术培训中心 组编 罗晓燕 白浩杰 党青青 杜宇宁 张宝昌 编著
出版社:清华大学出版社
出版时间:2023-04-01
ISBN:9787302623762
定价:¥69.80
购买这本书可以去
内容简介
本书在介绍深度学习、百度飞桨等相关知识的基础上,着重介绍了图像分类、目标检测、语义分割、人体关键点检测、图像生成、视频分类、图像文本检测和识别、图像识别等计算机视觉任务的实现原理及深度学习模型框架,并通过具体案例来详细介绍各任务的实现细节。 全书分为理论篇和实战篇。理论篇(第1~4章)梳理了计算机视觉技术的发展历程、主要任务、行业应用系统,同时简要介绍了深度学习开发框架、飞桨(PaddlePaddle)开发平台,以及深度学习的基础知识与网络模型架构。实战篇(第5~12章)结合计算机视觉的各个任务要求与技术发展,对其中经典的深度学习算法模型进行介绍。全书提供了实例代码,详解了在飞桨开发框架下各任务的模型实现过程。 本书适合作为高等院校人工智能、计算机视觉专业高年级本科生、研究生的教材,同时可作为计算机视觉相关任务实践教程,也可以作为科研工作者的参考书籍。
作者简介
暂缺《计算机视觉:飞桨深度学习实战》作者简介
目录
理论篇
第1章计算机视觉概述
1.1计算机视觉技术的发展
1.2计算机视觉任务概述
1.2.1计算机视觉经典任务
1.2.2计算机视觉常见任务
1.3计算机视觉处理应用系统
1.3.1计算机视觉行业产业链
1.3.2计算机视觉行业应用系统
1.4计算机视觉处理常用工具
1.4.1OpenCV简介
1.4.2OpenCVPython
1.4.3OpenCV的基础模块
1.4.4其他CV常用工具
1.5本章小结
参考文献
第2章深度学习开发框架
2.1常见的深度学习开发框架
2.1.1TensorFlow深度学习开发框架
2.1.2PyTorch深度学习开发框架
2.1.3PaddlePaddle深度学习开发框架
2.2飞桨基础
2.2.1开发环境
2.2.2开发套件
2.2.3工具组件
2.2.4开发平台
2.3本章小结
参考文献
第3章深度学习算法基础
3.1机器学习
3.2神经网络的基本组成
3.2.1神经元
3.2.2神经网络的结构
3.3神经网络的计算
3.3.1激活函数
3.3.2正向传播
3.3.3反向传播
3.3.4优化算法
3.4卷积神经网络的基本组成
3.4.1卷积层
3.4.2池化层
3.4.3ReLU激活函数
3.4.4全连接层
3.5深度学习模型的训练技巧
3.5.1归一化
3.5.2丢弃法
3.5.3权重衰减
3.5.4参数初始化
3.6本章小结
参考文献
第4章深度学习网络模型
4.1深度学习网络架构
4.2代表性的网络模型
4.2.1卷积神经网络模型
4.2.2循环神经网络模型
4.2.3Transformer网络模型
4.2.4复杂MLP网络模型
4.3网络搭建案例
4.3.1环境准备
4.3.2数据准备
4.3.3模型构建
4.3.4模型训练与验证
4.3.5模型可视化
4.4本章小结
参考文献
实战篇
第5章图像分类算法原理与实战
5.1图像分类任务的基本介绍
5.1.1图像分类技术的发展
5.1.2图像分类的评价指标
5.2基于残差的网络
5.2.1ResNet模型
5.2.2DenseNet模型
5.2.3DPN模型
5.3基于Transformer的网络
5.3.1ViT模型
5.3.2SwinTransformer模型
5.4轻量化的网络
5.4.1MobileNet模型
5.4.2PPLCNet模型
5.5飞桨实现图像分类案例
5.5.1环境安装与配置
5.5.2数据准备
5.5.3模型构建
5.5.4模型训练
5.5.5模型预测
5.6本章小结
参考文献
第6章目标检测算法原理与实战
6.1目标检测任务基本介绍
6.1.1目标检测技术的发展
6.1.2目标检测的评价指标
6.2Faster RCNN基本解析
6.2.1RCNN系列
6.2.2Faster RCNN整体架构
6.2.3Faster RCNN主要特点
6.3SSD基本解析
6.3.1SSD基本架构
6.3.2SSD主要特点
6.4YOLOv3基本解析
6.4.1YOLO系列
6.4.2YOLOv3主要特点
6.5FCOS基本解析
6.5.1FCOS基本架构
6.5.2FCOS主要特点
6.5.3损失函数的设计
6.5.4FCOS的优缺点
6.6DETR基本解析
6.6.1DETR基本结构
6.6.2DETR主要特点
6.7飞桨实现目标检测案例
6.7.1环境准备
6.7.2数据读取与增强
6.7.3模型构建
6.7.4模型训练
6.7.5模型测试与可视化
6.8本章小结
参考文献
第7章语义分割算法原理与实战
7.1语义分割任务的基本介绍
7.1.1语义分割的发展
7.1.2语义分割的评价指标
7.2深度学习语义分割基础网络
7.2.1FCN模型
7.2.2SegNet模型
7.2.3UNet模型
7.3语义分割网络的系列改进
7.3.1空洞可分离卷积: DeepLabv3
7.3.2低层细节信息保留: RefineNet
7.3.3全局语义特征聚合: OCRNet
7.4飞桨实现语义分割案例
7.4.1环境准备
7.4.2数据准备与预处理
7.4.3模型构建
7.4.4模型训练
7.4.5模型验证与评估
7.5本章小结
参考文献
第8章人体关键点检测原理与实战
8.1人体关键点检测任务的基本介绍
8.1.1人体关键点检测的发展
8.1.2人体关键点检测的评价指标
8.2人体关键点检测的经典方法
8.2.1模板匹配
8.2.2贝叶斯估计
8.3多尺度人体姿态检测方法
8.3.1Hourglass模型架构
8.3.2一阶Hourglass模块
8.3.3多阶Hourglass网络
8.4高分辨率人体姿态估计方法
8.4.1HRNet模型
8.4.2HigherHRNet 模型
8.5人体姿态识别OpenPose
8.5.1卷积姿态机CPM
8.5.2OpenPose架构
8.6飞桨实现人体关键点检测案例
8.6.1环境准备
8.6.2数据集准备
8.6.3模块导入
8.6.4数据集定义
8.6.5模型构建
8.6.6损失函数定义
8.6.7模型训练
8.6.8模型预测
8.7本章小结
参考文献
第9章图像生成算法原理与实战
9.1图像生成任务的基本介绍
9.1.1图像生成应用与发展
9.1.2图像生成的评价指标
9.2基于图像生成的图像转换: Pix2Pix
9.3基于图像生成的风格迁移: CycleGAN
9.3.1CycleGAN的网络结构
9.3.2CycleGAN的循环训练流程
9.4基于图像生成算法的图像属性控制: StyleGAN
9.4.1StyleGANv1的网络结构与训练技巧
9.4.2StyleGANv1对隐空间耦合度的量化
9.4.3StyleGANv2的改进
9.5飞桨实现图像生成案例
9.5.1环境准备
9.5.2数据读取与预处理
9.5.3模型构建
9.5.4模型训练
9.5.5模型验证与评估
9.5.6模型测试
9.6本章小结
参考文献
第10章视频分类原理与实战
10.1视频分类任务的基本介绍
10.1.1视频分类的应用与发展
10.1.2视频分类任务的评价指标
10.2基于时序划分的双流网络
10.2.1TSN模型
10.2.2SlowFast模型
10.3基于时序移位的类3D网络: TSM
10.3.1类3D思想
10.3.2网络设计
10.4基于自注意力机制的网络
10.4.1Nonlocal模型
10.4.2TimeSformer模型
10.5飞桨实现视频分类案例
10.5.1环境准备
10.5.2数据读取与预处理
10.5.3模型构建
10.5.4模型训练
10.5.5模型验证与评估
10.5.6模型测试
10.6本章小结
参考文献
第11章图像文本检测和识别原理与实战
11.1图像文本检测和识别任务的基本介绍
11.1.1OCR任务的应用与发展
11.1.2OCR任务的评价指标
11.2文本检测算法
11.2.1小尺度文本检测算法: CTPN
11.2.2场景文本检测算法: EAST
11.2.3任意形状文本检测器: SAST
11.2.4二值化检测模型: DBNet
11.3文本识别算法
11.3.1基于卷积循环神经网络的识别模型: CRNN
11.3.2基于空间注意力残差网络的识别模型: STARNet
11.3.3具有自动校正功能的鲁棒识别模型: RARE
11.3.4基于语义推理网络的识别模型: SRN
11.4端到端ORC方法
11.4.1FOTS模型
11.4.2PGNet模型
11.5飞桨实现OCR案例
11.5.1环境准备
11.5.2数据读取与预处理
11.5.3模型构建
11.5.4CTC Loss
11.5.5训练配置
11.5.6模型训练
11.5.7验证前准备
11.5.8开始验证
11.6本章小结
参考文献
第12章图像识别原理与实战
12.1图像识别系统任务流程基本概述
12.1.1图像识别任务基本介绍
12.1.2百度飞桨图像识别系统简介
12.2目标检测模块
12.3特征学习模块
12.3.1度量学习算法原理及主要内容
12.3.2深度度量学习常见算法框架
12.3.3百度飞桨中深度度量学习应用
12.4特征检索系统
12.4.1特征检索系统介绍
12.4.2特征检索原理介绍
12.5飞桨实现图像识别应用案例
12.5.1环境配置
12.5.2已知类别的图像识别
12.5.3商品识别与检索
12.5.4基于新的索引库的图像识别
12.6本章小结
参考文献
第1章计算机视觉概述
1.1计算机视觉技术的发展
1.2计算机视觉任务概述
1.2.1计算机视觉经典任务
1.2.2计算机视觉常见任务
1.3计算机视觉处理应用系统
1.3.1计算机视觉行业产业链
1.3.2计算机视觉行业应用系统
1.4计算机视觉处理常用工具
1.4.1OpenCV简介
1.4.2OpenCVPython
1.4.3OpenCV的基础模块
1.4.4其他CV常用工具
1.5本章小结
参考文献
第2章深度学习开发框架
2.1常见的深度学习开发框架
2.1.1TensorFlow深度学习开发框架
2.1.2PyTorch深度学习开发框架
2.1.3PaddlePaddle深度学习开发框架
2.2飞桨基础
2.2.1开发环境
2.2.2开发套件
2.2.3工具组件
2.2.4开发平台
2.3本章小结
参考文献
第3章深度学习算法基础
3.1机器学习
3.2神经网络的基本组成
3.2.1神经元
3.2.2神经网络的结构
3.3神经网络的计算
3.3.1激活函数
3.3.2正向传播
3.3.3反向传播
3.3.4优化算法
3.4卷积神经网络的基本组成
3.4.1卷积层
3.4.2池化层
3.4.3ReLU激活函数
3.4.4全连接层
3.5深度学习模型的训练技巧
3.5.1归一化
3.5.2丢弃法
3.5.3权重衰减
3.5.4参数初始化
3.6本章小结
参考文献
第4章深度学习网络模型
4.1深度学习网络架构
4.2代表性的网络模型
4.2.1卷积神经网络模型
4.2.2循环神经网络模型
4.2.3Transformer网络模型
4.2.4复杂MLP网络模型
4.3网络搭建案例
4.3.1环境准备
4.3.2数据准备
4.3.3模型构建
4.3.4模型训练与验证
4.3.5模型可视化
4.4本章小结
参考文献
实战篇
第5章图像分类算法原理与实战
5.1图像分类任务的基本介绍
5.1.1图像分类技术的发展
5.1.2图像分类的评价指标
5.2基于残差的网络
5.2.1ResNet模型
5.2.2DenseNet模型
5.2.3DPN模型
5.3基于Transformer的网络
5.3.1ViT模型
5.3.2SwinTransformer模型
5.4轻量化的网络
5.4.1MobileNet模型
5.4.2PPLCNet模型
5.5飞桨实现图像分类案例
5.5.1环境安装与配置
5.5.2数据准备
5.5.3模型构建
5.5.4模型训练
5.5.5模型预测
5.6本章小结
参考文献
第6章目标检测算法原理与实战
6.1目标检测任务基本介绍
6.1.1目标检测技术的发展
6.1.2目标检测的评价指标
6.2Faster RCNN基本解析
6.2.1RCNN系列
6.2.2Faster RCNN整体架构
6.2.3Faster RCNN主要特点
6.3SSD基本解析
6.3.1SSD基本架构
6.3.2SSD主要特点
6.4YOLOv3基本解析
6.4.1YOLO系列
6.4.2YOLOv3主要特点
6.5FCOS基本解析
6.5.1FCOS基本架构
6.5.2FCOS主要特点
6.5.3损失函数的设计
6.5.4FCOS的优缺点
6.6DETR基本解析
6.6.1DETR基本结构
6.6.2DETR主要特点
6.7飞桨实现目标检测案例
6.7.1环境准备
6.7.2数据读取与增强
6.7.3模型构建
6.7.4模型训练
6.7.5模型测试与可视化
6.8本章小结
参考文献
第7章语义分割算法原理与实战
7.1语义分割任务的基本介绍
7.1.1语义分割的发展
7.1.2语义分割的评价指标
7.2深度学习语义分割基础网络
7.2.1FCN模型
7.2.2SegNet模型
7.2.3UNet模型
7.3语义分割网络的系列改进
7.3.1空洞可分离卷积: DeepLabv3
7.3.2低层细节信息保留: RefineNet
7.3.3全局语义特征聚合: OCRNet
7.4飞桨实现语义分割案例
7.4.1环境准备
7.4.2数据准备与预处理
7.4.3模型构建
7.4.4模型训练
7.4.5模型验证与评估
7.5本章小结
参考文献
第8章人体关键点检测原理与实战
8.1人体关键点检测任务的基本介绍
8.1.1人体关键点检测的发展
8.1.2人体关键点检测的评价指标
8.2人体关键点检测的经典方法
8.2.1模板匹配
8.2.2贝叶斯估计
8.3多尺度人体姿态检测方法
8.3.1Hourglass模型架构
8.3.2一阶Hourglass模块
8.3.3多阶Hourglass网络
8.4高分辨率人体姿态估计方法
8.4.1HRNet模型
8.4.2HigherHRNet 模型
8.5人体姿态识别OpenPose
8.5.1卷积姿态机CPM
8.5.2OpenPose架构
8.6飞桨实现人体关键点检测案例
8.6.1环境准备
8.6.2数据集准备
8.6.3模块导入
8.6.4数据集定义
8.6.5模型构建
8.6.6损失函数定义
8.6.7模型训练
8.6.8模型预测
8.7本章小结
参考文献
第9章图像生成算法原理与实战
9.1图像生成任务的基本介绍
9.1.1图像生成应用与发展
9.1.2图像生成的评价指标
9.2基于图像生成的图像转换: Pix2Pix
9.3基于图像生成的风格迁移: CycleGAN
9.3.1CycleGAN的网络结构
9.3.2CycleGAN的循环训练流程
9.4基于图像生成算法的图像属性控制: StyleGAN
9.4.1StyleGANv1的网络结构与训练技巧
9.4.2StyleGANv1对隐空间耦合度的量化
9.4.3StyleGANv2的改进
9.5飞桨实现图像生成案例
9.5.1环境准备
9.5.2数据读取与预处理
9.5.3模型构建
9.5.4模型训练
9.5.5模型验证与评估
9.5.6模型测试
9.6本章小结
参考文献
第10章视频分类原理与实战
10.1视频分类任务的基本介绍
10.1.1视频分类的应用与发展
10.1.2视频分类任务的评价指标
10.2基于时序划分的双流网络
10.2.1TSN模型
10.2.2SlowFast模型
10.3基于时序移位的类3D网络: TSM
10.3.1类3D思想
10.3.2网络设计
10.4基于自注意力机制的网络
10.4.1Nonlocal模型
10.4.2TimeSformer模型
10.5飞桨实现视频分类案例
10.5.1环境准备
10.5.2数据读取与预处理
10.5.3模型构建
10.5.4模型训练
10.5.5模型验证与评估
10.5.6模型测试
10.6本章小结
参考文献
第11章图像文本检测和识别原理与实战
11.1图像文本检测和识别任务的基本介绍
11.1.1OCR任务的应用与发展
11.1.2OCR任务的评价指标
11.2文本检测算法
11.2.1小尺度文本检测算法: CTPN
11.2.2场景文本检测算法: EAST
11.2.3任意形状文本检测器: SAST
11.2.4二值化检测模型: DBNet
11.3文本识别算法
11.3.1基于卷积循环神经网络的识别模型: CRNN
11.3.2基于空间注意力残差网络的识别模型: STARNet
11.3.3具有自动校正功能的鲁棒识别模型: RARE
11.3.4基于语义推理网络的识别模型: SRN
11.4端到端ORC方法
11.4.1FOTS模型
11.4.2PGNet模型
11.5飞桨实现OCR案例
11.5.1环境准备
11.5.2数据读取与预处理
11.5.3模型构建
11.5.4CTC Loss
11.5.5训练配置
11.5.6模型训练
11.5.7验证前准备
11.5.8开始验证
11.6本章小结
参考文献
第12章图像识别原理与实战
12.1图像识别系统任务流程基本概述
12.1.1图像识别任务基本介绍
12.1.2百度飞桨图像识别系统简介
12.2目标检测模块
12.3特征学习模块
12.3.1度量学习算法原理及主要内容
12.3.2深度度量学习常见算法框架
12.3.3百度飞桨中深度度量学习应用
12.4特征检索系统
12.4.1特征检索系统介绍
12.4.2特征检索原理介绍
12.5飞桨实现图像识别应用案例
12.5.1环境配置
12.5.2已知类别的图像识别
12.5.3商品识别与检索
12.5.4基于新的索引库的图像识别
12.6本章小结
参考文献
猜您喜欢