The class Mat represents an n-dimensional dense numerical single-channel or multi-channel array. It can be used to store real or complex-valued vectors and matrices, grayscale or color images, voxel volumes, vector fields, point clouds, tensors, histograms (though, very high-dimensional histograms may be better stored in a SparseMat ). Mat类用于表示一个多维的单通道或者多通道的稠密数组。它能够用来存储实数或附属的向量、矩阵、灰度/彩色图像、立体元素、点云、张量,以及直方图(虽然高维的直方图用SparseMat保存比较好)。
以上摘自OpenCV 2.4.9的官方文档opencv2refman.pdf。
以前虽然能够比较熟练的使用OpenCV,但是最近感觉其实笔者自己对OpenCV的最底层数据结构Mat与IplImage都不怎么熟悉…… 由于笔者比较反感总是需要管理内存的IplImage,所以对Mat数据结构做一下学习工作还是有必要的。
官方说明文档opencv2refman.pdf中,写出了Mat的定义如下:
class CV_EXPORTS Mat
{
public:
// ... a lot of methods ...
...
/*! includes several bit-fields:
- the magic signature
- continuity flag
- depth
- number of channels
*/
int flags;
//! the array dimensionality, >= 2
int dims;
//! the number of rows and columns or (-1, -1) when the array has more than 2 dimensions
int rows, cols;
//! pointer to the data
uchar* data;
//! pointer to the reference counter;
// when array points to user-allocated data, the pointer is NULL
int* refcount;
// other members
...
};
下面笔者将从几个方面总结Mat数据结构的主要组成。
参考网址: 《OpenCV中对Mat里面depth,dims,channels,step,data,elemSize和数据地址计算的理解 》 《OpenCV Mat的常见属性》 《OpenCV学习笔记(四十)——再谈OpenCV数据结构Mat详解》
参考文档: 《opencv2refman.pdf》
如上面的Mat定义源码,Mat类中有很多重要的数据类型成员。 下面进行简单的列举。
把这四个数据成员放在一起,是因为这四个数据成员相互之间有关系。
数据的存储一直都是个值得关注的问题,所以数据元素存储的位数和范围就十分重要了。depth就体现了每一个像素的位数,即深度。 Mat中包含的图像深度如下所示:
另外还需要注意:大部分OpenCV的函数支持的数据深度只有8位和32位,所以尽量使用CV_64F。
channels表示了矩阵拥有的通道数量,这个比较容易理解:
type表示矩阵中元素的类型(depth)与矩阵的通道个数(channels),可以理解成上面的depth与channels的综合说明。type是一系列预定义的常量,命名规则如下:
CV_+位数+数据类型+通道数
具体有如下值:
数据类型 | 1 | 2 | 3 | 4 |
---|---|---|---|---|
CV_8U | CV_8UC1 | CV_8UC2 | CV_8UC3 | CV_8UC4 |
CV_8S | CV_8SC1 | CV_8SC2 | CV_8SC3 | CV_8SC4 |
CV_16U | CV_16UC1 | CV_16UC2 | CV_16UC3 | CV_16UC4 |
CV_16S | CV_16SC1 | CV_16SC2 | CV_16SC3 | CV_16SC4 |
CV_32S | CV_32SC1 | CV_32SC2 | CV_32SC3 | CV_32SC4 |
CV_32F | CV_32FC1 | CV_32FC2 | CV_32FC3 | CV_32FC4 |
CV_64F | CV_64FC1 | CV_64FC2 | CV_64FC3 | CV_64FC4 |
表格中,行代表了通道数量channels,列代表了图像深度depth。 例如CV_8UC3,可以拆分为:
注:type一般是在创建Mat对象时设定,若要去的Mat的元素类型,可以不使用type,使用depth。
elemSize表示了矩阵中每一个元素的数据大小,单位是字节。公式如下:
elemSize = channels * depth / 8
例如type == CV_16SC3,则elemSize = 3 * 16 / 8 = 6 Bytes。
elemSize1表示了矩阵元素的一个通道占用的数据大小,单位是字节。公式如下:
elemSize = depth / 8
例如type == CV_16SC3,则elemSize1 = 16 / 8 = 2 Bytes。
使用OpenCV处理图像时,最普遍的处理方式便是遍历图像,即访问所有的图像像素点。但有的算法还需要访问目标像素的邻域,所以这时候就需要了解访问Mat数据元素地址的方式。
假设有矩阵M,则数据元素的地址计算公式如下:
如果是二维数组,则上述公式就简化成:
注:式中m = M.dims,即矩阵的维度。
假设存在一个二维矩阵如下图所示:
上面是一个3 × 4的矩阵。此时我们按照数据类型为CV_8U, CV_8UC3的情况,分别对其进行讨论。
首先假设其数据类型为CV_8U,也就是单通道的uchar类型,则可以得出上面的数据成员情况分别为:
若假设其数据类型为CV_8UC3,也就是三通道的uchar类型,则可以得出上面的数据成员情况分别为:
假设存在一个三维矩阵如下图所示:
上面是一个3 × 4 × 6的矩阵。假设其数据类型为CV_16SC4,此时对其进行讨论。
关于OpenCV地址访问方法及效率的部分,请见笔者的博文《OpenCV像素点邻域遍历效率比较,以及访问像素点的几种方法 》。