书籍详情
自然场景文本检测算法研究
作者:赵雪专 李玲玲 刘粉林 罗向阳
出版社:人民邮电出版社
出版时间:2021-12-01
ISBN:9787115583871
定价:¥69.90
购买这本书可以去
内容简介
以深度学习为基础的文本检测算法有基于回归的模型和基于分割的模型,目前这两种模型的应用效果各有优劣。为解决回归模型对训练数据的依赖,以及分割模型受目标尺寸影响的问题,本书提出了两种新的算法:TSFnet和Mnet。 全书分为5章,概述了自然场景下文本检测的研究现状,陈述了相关算法的问题、数据集与存在的挑战,并通过实验,对基于融合网络的TSFnet模型及结合区域网络与注意力网络的Mnet模型进行了详细的介绍,后对相关的应用进行了简介。本书结构清晰,文字流畅,图文并茂,适合从事场景文本检测与识别研究的相关读者阅读,也适合作为高校相关专业学生的参考书。
作者简介
主编: 赵雪专,男,1986年7月出生,讲师,博士,博士毕业于中国科学院大学,主要研究方向为机器学习与模式识别,研究成果主要应用有于计算机视觉领域。近年来,主持或参与多项国家和省部级科研项目,发表相关学术论文20余篇。申请专利24项,其中授权13项。主持完成多项横向项目,如探达定位系统、视频摘要系统、智能视频监控系统、DSP无线车型识别系统、疲劳检测系统等。 副主编: 李玲玲,女,1973年1月出生,教授,博士后,郑州航空工业管理学院智能工程学院院长,多模信息感知河南省工程实验室主任、河南省航空物流大数据工程研究中心主任。博士毕业于华中科技大学图像识别与人工智能研究所,厦门大学博士后流动站出站。研究方向为计算机视觉。河南省创新人才杰出青年,河南省学术技术带头人,河南省“创新型科技团队”带头人、河南省高校科技创新团队带头人、郑州市科技创新团队带头人,河南省高等学校青年骨干教师,河南省教育厅学术带头人,河南省计算机教育学会常务理事。国家自然科学基金评审,通信学报、中国图像图形学报、武汉大学学报等评审。主持国家自然科学基金面上项目、人才支持计划、河南省科技创新杰出青年基金、航空科学基金、河南省科技攻关项目等科研项目16项;完成省级项目鉴定9项;出版科研5部;先后获得河南省科学技术进步三等奖等奖项15项。 罗向阳,男,1978年生,战略支援部队信息工程大学教授、博导,河南省网络空间态势感知重点实验室主任,国防科技青年基金获得者,先后入选河南省科技创新杰出青年和杰出人才、中原科技创新领军人才。先后主持国家自然科学基金5项(其中重点项目2项),国家863项目军口课题、国家重点研发计划课题、装发预研重点项目等国家、军队和省部级科研项目30余项,在IEEE JSAC、TIFS、TDSC、TII、TMM、TCSVT、TCC、TCSS、ACM TIOT、ACM TIOS、ACM TOMM、IEEE/ACM TNET、《中国科学》、《计算机学报》、《软件学报》、《计算机研究与发展》和IJCAI、WWW、INFOCOM、ACM MM、IH、IH&MMSec等国内外重要学术期刊/会议发表论文200余篇,其中被SCI检索120余篇,5篇论文入选ESI高被引论文。在科学出版社出版《网络空间测绘》专著1部,获发明专利授权30余项。先后获百篇优博提名奖和全军博士学位论文奖,获技术发明一等奖和中国电子学会技术发明一等奖各1项、军队和河南省科技进步二等奖4项,军队教学成果二等奖1项,指导研究生获全军和河南省学位论文4篇。
目录
目 录
第 1章 绪论 1
1.1研究背景 1
1.2 问题与挑战 3
1.3主要研究内容 5
1.4 本文的组织结构 5
第 2章 场景文本检测算法综述 7
2.1简介 7
2.2场景文本检测和识别过程概述 8
2.3场景文本检测和识别算法分类 10
2.3.1基于传统机器学习的场景文本检测和识别算法 10
2.3.2基于深度学习的场景文本检测和识别算法 28
2.4文本检测和识别的评价指标 41
2.5文本检测和识别的数据集 42
2.5.1 ICDAR数据集 42
2.5.2 SVT数据集 44
2.5.3 IIIT数据集 45
2.5.4 KAIST数据集 46
2.5.5 CTW数据集 46
2.5.6 RCTW-17数据集 47
2.5.7 ICPR MWI 2018数据集 48
2.5.8 Total-Text数据集 48
2.5.9 Google FSNS数据集 49
2.5.10 COCO-TEXT数据集 49
2.5.11 Synthetic数据集 50
2.6 总结 50
第3章 基于融合网络的TSFnet模型 52
3.1 问题形成 52
3.2 相关研究 52
3.2.1基于回归的模型 53
3.2.2 基于分割的模型 53
3.3 TSFnet 54
3.4实验 60
3.4.1评价指标 60
3.4.2 参数设置 60
3.4.3 结果与分析 61
3.5 本章小结 64
第4章 结合区域建议网络与注意力网络的Mnet算法 66
4.1 问题形成 66
4.2 相关研究 66
4.2.1基于回归的模型 66
4.2.2 基于分割的模型 67
4.2.3 两阶段检测模型 67
4.3 Mnet 68
4.3.1 Scale-RPN 69
4.3.2回归网络 70
4.3.3 分割网络 70
4.3.4 注意力网络 71
4.4 实验 72
4.4.1评价指标 72
4.4.2参数设置 72
4.4.3实验对比与分析 73
4.5 本章小结 75
第5章 场景文本检测与识别应用 77
5.1卡证文字检测与识别 77
5.1.1证件文字检测与识别 77
5.1.2 银行卡文字检测与识别 79
5.1.3 名片文字检测与识别 79
5.1.4 营业执照文字检测与识别 80
5.2票据文字检测与识别 80
5.3汽车场景文字检测与识别 81
5.3.1 车牌检测与识别 81
5.3.2 汽车VIN码检测与识别 83
5.4 文档文字检测与识别 83
5.5 自然场景文字检测识别 84
第6章 总结与展望 86
6.1 总结 86
6.2展望 86
参考文献 88
第 1章 绪论 1
1.1研究背景 1
1.2 问题与挑战 3
1.3主要研究内容 5
1.4 本文的组织结构 5
第 2章 场景文本检测算法综述 7
2.1简介 7
2.2场景文本检测和识别过程概述 8
2.3场景文本检测和识别算法分类 10
2.3.1基于传统机器学习的场景文本检测和识别算法 10
2.3.2基于深度学习的场景文本检测和识别算法 28
2.4文本检测和识别的评价指标 41
2.5文本检测和识别的数据集 42
2.5.1 ICDAR数据集 42
2.5.2 SVT数据集 44
2.5.3 IIIT数据集 45
2.5.4 KAIST数据集 46
2.5.5 CTW数据集 46
2.5.6 RCTW-17数据集 47
2.5.7 ICPR MWI 2018数据集 48
2.5.8 Total-Text数据集 48
2.5.9 Google FSNS数据集 49
2.5.10 COCO-TEXT数据集 49
2.5.11 Synthetic数据集 50
2.6 总结 50
第3章 基于融合网络的TSFnet模型 52
3.1 问题形成 52
3.2 相关研究 52
3.2.1基于回归的模型 53
3.2.2 基于分割的模型 53
3.3 TSFnet 54
3.4实验 60
3.4.1评价指标 60
3.4.2 参数设置 60
3.4.3 结果与分析 61
3.5 本章小结 64
第4章 结合区域建议网络与注意力网络的Mnet算法 66
4.1 问题形成 66
4.2 相关研究 66
4.2.1基于回归的模型 66
4.2.2 基于分割的模型 67
4.2.3 两阶段检测模型 67
4.3 Mnet 68
4.3.1 Scale-RPN 69
4.3.2回归网络 70
4.3.3 分割网络 70
4.3.4 注意力网络 71
4.4 实验 72
4.4.1评价指标 72
4.4.2参数设置 72
4.4.3实验对比与分析 73
4.5 本章小结 75
第5章 场景文本检测与识别应用 77
5.1卡证文字检测与识别 77
5.1.1证件文字检测与识别 77
5.1.2 银行卡文字检测与识别 79
5.1.3 名片文字检测与识别 79
5.1.4 营业执照文字检测与识别 80
5.2票据文字检测与识别 80
5.3汽车场景文字检测与识别 81
5.3.1 车牌检测与识别 81
5.3.2 汽车VIN码检测与识别 83
5.4 文档文字检测与识别 83
5.5 自然场景文字检测识别 84
第6章 总结与展望 86
6.1 总结 86
6.2展望 86
参考文献 88
猜您喜欢