书籍详情

计算机视觉

计算机视觉

作者:(美)Linda G.Shapiro,(美)George C.Stockman著;赵清杰,钱芳,蔡利栋译;赵清杰译

出版社:机械工业出版社

出版时间:2005-03-01

ISBN:9787111159728

定价:¥55.00

购买这本书可以去
内容简介
  本书系统地介绍了计算机视觉方面的基础知识,详细讨论了从图像自动抽取重要信息的相关理论,内容包括最近出现的研究成果。本书取材新颖精炼,重点突出,以解决实际问题为目的。前11章讨论的是2D情况;第12章到第15章从2D情况扩展到3D情况;第16章介绍了利用计算机视觉技术的实际应用系统。书中的大量实例及习题,贴近生活,面向应用,富有情趣。本书适合作为高等院校计算机及相关专业的高年级本科生和研究和的教材,也可供相关技术人员参考。长期以来,科学家与科幻作家一直梦想着人类能够制造出智能机器,而这种智能机器首先要能够对视觉信息进行理解。本书详细讨论了从图像自动抽取重要信息和理论和技术,把利用计算机视觉技术把利用计算机视觉技术解决问题的重要研究内容汇集到一起。随着计算机技术的最新发展,计算机图像已经成为一种经济灵活的技术手段,并已渗透到各行各业。图像计算不再只属于科学研究领域,甚至成为人们的业余爱好。本书适合作为高等院校计算机及相关专业的高年级本科生和研究和的教材,也可供相关技术人员参考。本书英文版被美国华盛顿大学等高等院校采用为教材。本书特点:●除了传统内容外,增加了图像数据库,虚拟现实和增强现实方面的内容;●介绍了两个运用计算机视觉技术的实际系统;●应用面涉及工业、医学、地产、多媒体及计算机绘图;●内含大量习题和编程项目,以及大量极具说服力的图片;●书中提供大量相关网站,包括额外图像档案文件,图像处理代码和幻灯片等。
作者简介
  LindaG.Shapiro是华盛顿大学计算机科学与工程学教授及电子工程学教授。她于1974年在艾奥瓦大学获得计算机博士学位。她曾在堪萨斯州立大学、维吉尼亚工学院、维吉尼亚州立大学任教,并在国际机器视觉组织负责智能系统方面的工作。Shapiro教授是Imageunderstranding杂志的主编,是ComputervisionandimageUnderstanding以及patternrecognition杂志的编委。她与RobertM.Haralick一起合写了Computerandrobotvision一书。1995年她当选为IEEE会士,2000年当选为模式识别国际协会的会士。相关图书编译原理C++语言的设计和演化并行计算导论(原书第2版)信息论、编码与密码学软件需求3D游戏卷1实时渲染与软件技术3D游戏卷2动画与高级实时渲染技术数字图像处理疑难解析现代信息检索CAXA数控铣CAD/CAM技术C语言的科学和艺术信息系统原理:原书第6版操作系统现代操作系统(第2版)计算机网络:自顶向下方法与Internet特色(原书第3版)高级编译器设计与实现计算机网络系统方案(原书第3版)3D计算机图形学(原书第3版)C程序设计语言(第2版·新版)习题解答计算机科学概论(原书第2版)C++编程思想。第2卷:实用编程技术模式分析的核方法微机接口技术实验教程数据仓库(原书第3版)神经网络原理(原书第2版)离散数学导学数据库设计教程(第2版)组合数学(原书第4版)JAVA编程思想(第2版)数据库系统导论UNIX系统编程并行程序设计数据库与事务处理计算机网络与因特网(原书第4版)人工智能:英文可扩展并行计算技术、结构与编程数据库原理、编程与性能Java面向对象程序设计教程嵌入式微控制器
目录
第1章  绪论        1
1.1  机器视觉        1
1.2  应用问题        2
1.2.1  数字图像        2
1.2.2  查询图像数据库        3
1.2.3  检查交叉支撑杆上的螺孔        3
1.2.4  诊断人脑内部        5
1.2.5  处理扫描的文本页面        6
1.2.6  解释积雪覆盖        6
1.2.7  理解零件场景        7
1.3  图像运算        8
1.3.1  邻域运算        8
1.3.2  整幅图像增强        9
1.3.3  多幅图像运算        9
1.3.4  图像特征计算        10
1.3.5  抽取非图像表示        10
1.4  面临的问题        11
1.5  计算机和应用软件        11
1.6  相关领域        12
1.7  内容安排        12
1.8  参考文献        12
1.9  附加习题        14
第2章  图像生成与图像表示        17
2.1  光线感测        17
2.2  成像设备        18
2.2.1  CCD摄像机        18
2.2.2  图像形成        19
2.2.3  视频摄像机        20
2.2.4  人眼        21
2.3  数字图像中的问题*        21
2.3.1  几何畸变        21
2.3.2  散射        21
2.3.3  光晕        21
2.3.4  CCD差异        22
2.3.5  削波与逆变        22
2.3.6  彩色畸变        22
2.3.7  量化效应        22
2.4  图像函数与数字图像        22
2.4.1  图像类型        22
2.4.2  图像量化与空间度量        24
2.5  数字图像格式*        27
2.5.1  图像文件头        28
2.5.2  图像数据        28
2.5.3  数据压缩        28
2.5.4  常用图像格式        28
2.5.5  游程编码二值图像        28
2.5.6  PGM格式        28
2.5.7  GIF格式        29
2.5.8  TIFF格式        30
2.5.9  JPEG格式        30
2.5.10  PostScript格式        30
2.5.11  MPEG格式        30
2.5.12  图像格式比较        31
2.6  成像影响因素        31
2.7  从二维图像到三维结构        32
2.8  5种参考坐标系        33
2.8.1  像素坐标系I        33
2.8.2  物体坐标系O        34
2.8.3  摄像机坐标系C        34
2.8.4  实际图像坐标系F        34
2.8.5  世界坐标系W        34
2.9  其他类型的传感器*        34
2.9.1  测微密度计        34
2.9.2  彩色图像和多谱图像        35
2.9.3  X射线        35
2.9.4  磁共振成像        36
2.9.5  距离扫描仪和深度图像        36
2.10  参考文献        38
第3章  二值图像分析        39
3.1  像素与邻域        39
3.2  图像模板运算        40
3.3  目标计数        41
3.4  连通成分标记        42
3.4.1  递归标记算法        43
3.4.2  逐行标记算法        45
3.5  二值图像形态学        49
3.5.1  结构元        49
3.5.2  基本运算        49
3.5.3  二值形态学的应用        51
3.5.4  条件膨胀        54
3.6  区域特征        54
3.7  区域邻接图        61
3.8  灰度级图像阈值化        62
3.8.1  直方图阈值选择        62
3.8.2  自动阈值处理:Otsu方法*        63
3.9  参考文献        66
第4章  模式识别        69
4.1  模式识别问题        69
4.2  分类模型        70
4.2.1  类别        70
4.2.2  传感器/变换器        70
4.2.3  特征抽取算子        70
4.2.4  分类器        70
4.2.5  分类系统的建立        70
4.2.6  系统错误估计        71
4.2.7  误报和漏报        72
4.3  查准率与查全率        72
4.4  特征表示        73
4.5  特征向量表示        74
4.6  分类器的实现        75
4.6.1  最近均值分类        75
4.6.2  最近邻分类        76
4.7  结构方法        77
4.8  混淆矩阵        79
4.9  决策树        79
4.10  贝叶斯决策        83
4.11  多维数据决策        87
4.12  机器学习        88
4.13  人工神经网络*        88
4.13.1  感知器模型        88
4.13.2  多层前向网络        91
4.14  参考文献        94
第5章  图像滤波与增强        95
5.1  图像处理        95
5.1.1  改善图像质量        95
5.1.2  检测低层特征        95
5.2  灰度级映射        96
5.3  去除小图像区域        99
5.3.1  去除盐椒噪声        99
5.3.2  去除小成分        100
5.4  图像平滑        100
5.5  中值滤波        102
5.6  差分模板边缘检测        104
5.6.1  1D信号差分        104
5.6.2  2D图像差分算子        107
5.7  高斯滤波与LOG边缘检测        111
5.7.1  LOG边缘检测        112
5.7.2  人类视觉的边缘检测        114
5.7.3  马尔-海尔德斯理论        115
5.8  Canny边缘检测        116
5.9  匹配滤波模板*        117
5.9.1  向量空间        117
5.9.2  利用正交基        119
5.9.3  柯西-施瓦茨不等式        120
5.9.4  m×n图像的向量空间        120
5.9.5  2×2邻域的Robert基        120
5.9.6  3×3邻域的Frei-Chen基        121
5.10  卷积和交叉相关*        124
5.10.1  模板运算定义        124
5.10.2  卷积运算        125
5.10.3  并行计算        128
5.11  正弦波空间频率分析*        128
5.11.1  傅里叶基        128
5.11.2  2D图像函数        131
5.11.3  离散傅里叶变换        132
5.11.4  带通滤波器        134
5.11.5  傅里叶变换讨论        135
5.11.6  卷积定理*        135
5.12  总结和讨论        136
5.13  参考文献        137
第6章  颜色与明暗分析        139
6.1  颜色物理学        139
6.1.1  感测被照射物体        140
6.1.2  其他因素        141
6.1.3  感受器的敏感性        141
6.2  RGB三基色        142
6.3  其他基色系统        143
6.3.1  CMY减色系统        143
6.3.2  HSI系统        144
6.3.3  电视信号的YIQ与YUV系统        146
6.3.4  基于颜色的分类        147
6.4  颜色直方图        147
6.5  颜色分割        149
6.6  明暗分析        150
6.6.1  来自单一光源的照射        151
6.6.2  漫反射        151
6.6.3  镜面反射        152
6.6.4  随距离增大而变暗        153
6.6.5  复杂因素        154
6.6.6  phong明暗模型*        154
6.6.7  基于明暗的人类感知        155
6.7  相关话题*        155
6.7.1  颜色应用        155
6.7.2  人类的色感机制        155
6.7.3  多谱图像        156
6.7.4  主题图像        156
6.8  参考文献        156
第 7章  纹理分析        159
7.1  纹理、纹理素和统计        159
7.2  基于纹理素的描述        160
7.3  定量纹理测度        161
7.3.1  边缘密度和方向        161
7.3.2  局部二值分解        162
7.3.3  共生矩阵和特征        162
7.3.4  Laws纹理能量测度        164
7.3.5  自相关和功率谱        166
7.4  纹理分割        166
7.5  参考文献        167
第8章  基于内容的图像检索        169
8.1  图像数据库实例        169
8.2  图像数据库查询        170
8.3  示例查询        171
8.4  图像距离度量        171
8.4.1  颜色相似性度量        172
8.4.2  纹理相似性度量        174
8.4.3  形状相似性度量        175
8.4.4  目标检测及空间关系度量        179
8.5  数据库组织        182
8.5.1  标准索引        182
8.5.2  空间索引        184
8.5.3  基于内容的多距离测度图像索引        184
8.6  参考文献        185
第9章  二维运动分析        187
9.1  运动现象及应用        187
9.2  图像相减        188
9.3  计算运动向量        189
9.3.1  Decathlete游戏        190
9.3.2  点对应        191
9.3.3  MPEG视频压缩        194
9.3.4  图像流计算*        195
9.3.5  图像流方程*        195
9.3.6  利用传播约束求解图像流*        197
9.4  计算运动点路径        197
9.5  检测视频中的显著变化        202
9.5.1  视频序列分割        203
9.5.2  忽略摄影特效        205
9.5.3  存储视频子序列        205
9.6  参考文献        205
第10章  图像分割        207
10.1  区域分割        207
10.1.1  聚类方法        208
10.1.2  区域增长        214
10.2  区域表示        215
10.2.1  覆盖图        215
10.2.2  标记图像        216
10.2.3  边界编码        216
10.2.4  四叉树        217
10.2.5  特征表        217
10.3  轮廓分割        218
10.3.1  区域边界跟踪        218
10.3.2  Canny边缘检测和连接        220
10.3.3  相邻连贯的边缘生成曲线        223
10.3.4  用霍夫变换检测直线和圆弧        225
10.4  线段拟合模型        231
10.5  识别更高层结构        235
10.5.1  条带检测        235
10.5.2  角点检测        236
10.6  运动一致性分割        237
10.6.1  时空边界        237
10.6.2  运动轨迹聚类        237
10.7  参考文献        239
第11章  2D匹配        241
11.1  2D数据配准        241
11.2  点的表示        242
11.2.1  参考坐标系        242
11.2.2  齐次坐标        243
11.3  仿射映射函数        243
11.3.1  缩放        243
11.3.2  旋转        244
11.3.3  正交和标准正交变换*        245
11.3.4  平移        245
11.3.5  旋转、缩放和平移        245
11.3.6  仿射变形实例        246
11.3.7  目标识别与定位实例        247
11.3.8  一般仿射变换*        249
11.4  最佳2D仿射变换*        250
11.5  仿射映射法2D目标识别        251
11.5.1  局部特征焦点法        252
11.5.2  位姿聚类        254
11.5.3  几何散列        256
11.6  相关匹配法2D目标识别        259
11.6.1  解释树        260
11.6.2  离散松弛        262
11.6.3  连续松弛*        264
11.6.4  相关距离匹配        266
11.6.5  相关索引        269
11.7  非线性变形        269
11.7.1  径向畸变矫正        271
11.7.2  多项式映射        272
11.8  总结        272
11.9  参考文献        272
第12章  2D图像中的3D信息        275
12.1  本征图像        275
12.2  线条图标记        278
12.3  2D图像中的3D线索        283
12.4  其他3D现象        286
12.4.1  从X恢复形状        286
12.4.2  消隐点        289
12.4.3  根据焦距变化求深度        289
12.4.4  运动现象        290
12.4.5  边界和虚拟线        290
12.4.6  非偶然对齐        290
12.5  透视成像模型        291
12.6  通过立体视觉求深度        293
12.7  薄透镜方程*        297
12.8  总结性讨论        300
12.9  参考文献        300
第13章  3D感知与目标位姿计算        303
13.1  一般体视结构        303
13.2  3D仿射变换        304
13.2.1  坐标系        305
13.2.2  平移        306
13.2.3  缩放        306
13.2.4  旋转        306
13.2.5  任意旋转        308
13.2.6  基于变换的比对        309
13.3  摄像机模型        311
13.3.1  透视变换矩阵        311
13.3.2  正投影与弱透视投影        314
13.3.3  基于多摄像机的3D点计算        315
13.4  最佳仿射标定矩阵        317
13.4.1  标定物        317
13.4.2  最小二乘问题        317
13.4.3  仿射方法讨论        321
13.5  使用结构光        322
13.6  简单的位姿估计过程        323
13.7  改进的摄像机标定法*        327
13.7.1  摄像机内部参数        327
13.7.2  摄像机外部参数        328
13.7.3  标定举例        331
13.8  位姿估计*        334
13.8.1  2D-3D点对应求位姿        334
13.8.2  约束线性最优化        335
13.8.3  计算变换Tr={R,T}        336
13.8.4  位姿验证和位姿最优化        337
13.9  3D目标重建        338
13.9.1  数据获取        338
13.9.2  视图配准        340
13.9.3  表面重建        341
13.9.4  空间切割算法        341
13.10  从明暗恢复形状        343
13.10.1  光度立体        345
13.10.2  结合空间约束        346
13.11  从运动恢复结构        346
13.12  参考文献        348
第14章  3D模型和匹配        351
14.1  模型表示        351
14.1.1  3D网格模型        351
14.1.2  表面-边-顶点模型        352
14.1.3  广义圆柱体模型        353
14.1.4  八叉树        354
14.1.5  超二次曲面模型        355
14.2  实际3D模型与视类模型        356
14.3  物理学模型和可变形模型        357
14.3.1  蛇形活动轮廓模型        357
14.3.2  3D气球模型        360
14.3.3  建立心脏跳动模型        361
14.4  3D目标识别范例        361
14.4.1  几何模型比对匹配        362
14.4.2  关系模型匹配        367
14.4.3  功能模型匹配        372
14.4.4  基于外观的识别        374
14.5  参考文献        379
第15章  虚拟现实        383
15.1  虚拟现实系统的特征        383
15.2  虚拟现实的应用        384
15.2.1  建筑漫游        384
15.2.2  飞行仿真        384
15.2.3  解剖组织的交互式分割        384
15.3  增强现实        385
15.4  遥操作        386
15.5  虚拟现实设备        388
15.5.1  头戴式显示器        389
15.5.2  虚拟灵巧手术        390
15.5.3  立体显示设备        390
15.6  虚拟现实感知设备        391
15.6.1  视觉        391
15.6.2  听觉        391
15.6.3  位姿        391
15.6.4  触觉        391
15.6.5  运动觉        391
15.7  简单3D模型绘制        392
15.8  实际图像和合成图像融合        393
15.9  人机交互与心理问题        395
15.10  参考文献        395
第16章  案例研究        397
16.1  Veggie Vision系统        397
16.1.1  应用场合和要求        397
16.1.2  系统设计        398
16.1.3  识别过程        398
16.1.4  详细分析        399
16.1.5  性能分析        400
16.2  基于虹膜的身份识别        401
16.2.1  对识别系统的要求        401
16.2.2  系统设计        402
16.2.3  系统性能        404
16.3  参考文献        405
索引        407
猜您喜欢

读书导航