本文收集经典的计算机视觉书籍,共六册,覆盖二维、三维的经典理论知识,方便用户打下扎实基础,其中包含计算机视觉中的数学,二维图像处理、物体检测、目标跟踪、平面几何、三维重建、立体视觉、多视图几何等等……
01 计算机视觉:一种现代方法
《计算机视觉:一种现代方法》是近年较为成功的一本计算机视觉教材,内容涉及几何摄像机模型、光照与着色、彩色、线性滤波器、局部图像特性、纹理、立体视觉、从运动求取结构、聚类分割、组合与模型拟合、跟踪、配准、平滑曲面及其轮廓、距离数据、分类、图像分类、图像目标检测、目标识别专题、基于图像的建模与渲染、图像中人的研究、图像搜索与检索、优化技术等。
全书条理清楚,系统性强,且各章相对独立;此外,全书理论联系实际,并纳入了近年来该领域的最新研究成果。
02 计算机视觉:算法与应用
《计算机视觉:算法与应用》探索了用于分析和解释图像的各种常用技术,描述了具有一定挑战性的视觉应用方面的成功实例,兼顾专业的医学成像和图像编辑与交织之类有趣的大众应用,以便学生能够将其应用于自己的照片和视频,从中获得成就感和乐趣。
本书从科学的角度介绍基本的视觉问题,将成像过程的物理模型公式化,然后在此基础上生成对场景的逼真描述。作者还运用统计模型来分析和运用严格的工程方法来解决这些问题。本书作为本科生和研究生“计算机视觉”课程的理想教材,适合计算机和电子工程专业学生使用,重点介绍现实中行之有效的基本技术,通过大量应用和练习来鼓励学生大胆创新。
此外,本书的精心设计和编排,使其可以作为计算机视觉领域中一本独特的基础技术参考和最新研究成果文献。
03 视觉计算基础:计算机视觉、图形学和图像处理的核心概念
本书涵盖了视觉计算的基本概念。为创建、获取、分析和操作视觉数据(如二维图像,三维模型)提供了一个统一的计算和数学处理方法。书中涉及的基本原理包括:卷积、傅里叶变换、滤波器、几何变换、超极几何、三维重建、色彩和图像合成管道。
04 An Invitation to 3-D Vision:From Images to Geometric Models
本书解决了计算机视觉中的一个中心问题-如何使用主要来自线性代数和矩阵理论的技术从一组二维图像中恢复3-D结构和运动。重点在于开发一个统一的框架,以研究3-D场景的多个图像的几何形状并从这些图像中重建几何模型。该书还涵盖了图像形成,基本图像处理和特征提取的相关方面。作者通过提供有关工作视觉算法和系统实施的分步说明,弥合了理论与实践之间的鸿沟。
05 计算机视觉中的多视图几何
用于理解真实世界的三维结构是计算机视觉领域的一个基本问题。内容包括三维几何与重建所需要的计算相关的几何原则及物体的代数表达。本书以统一框架的形式给出了场景重建的理论与实现细节。同时作者也提供了详尽的背景知识、应用和实现算法的解释。
本书涵盖了摄像机投影矩阵、基本矩阵和三焦点张量的几何原理、和它们的代数表达,并配有实际的例子,如它们在由多幅图像进行景物重构中的应用。
https://www.robots.ox.ac.uk/~vgg/hzbook/index.html
06 计算机视觉中的数学方法
《计算机视觉中的数学方法》由射影几何、矩阵与张量、模型估计3篇组成,它们是三维计算机视觉所涉及的基本数学理论与方法。
射影几何学是三维计算机视觉的数学基础,《计算机视觉中的数学方法》着重介绍射影几何学及其在视觉中的应用,主要内容包括:平面与空间射影几何,摄像机几何,两视点几何,自标定技术和三维重构理论。
矩阵与张量是描述和解决三维计算机视觉问题的必要数学工具,《计算机视觉中的数学方法》着重介绍与视觉有关的矩阵和张量理论及其应用,主要内容包括:矩阵分解,矩阵分析,张量代数,运动与结构,多视点张量。
模型估计是三维计算机视觉的基本问题,通常涉及变换或某种数学量的估计,《计算机视觉中的数学方法》着重介绍与视觉估计有关的数学理论与方法,主要内容包括:迭代优化理论,参数估计理论,视觉估计的代数方法、几何方法、鲁棒方法和贝叶斯方法。