
矩函数在图像分析中有着广泛的应用,如模式识别、目标分类、目标识别与方位估计、图像编码和重构等。一个从一幅数字图像中计算出来的矩集,通常描述了该图像形状的全局特征,并提供大量的关于该图像不同类型的几何特性信息。
将一幅图像看成一个二维密度分布 f(x,y),函数值 f(x,y)表示点 (x,y) 处图像像素的亮度值;用 ζ 表示 x−y 平面上图像的区域,即 f(x,y) 的定义域范围。设一幅图像的亮度函数为 f(x,y),它的 (p+q) 阶矩函数的一般定义如下:
\begin{aligned} \Phi_{pq} = \iint\limits_\zeta \Psi_{pq}(x,y) f(x,y) \mathrm{d}x \mathrm{d}y \qquad p,q = 0,1,2,\cdots \tag{1} \end{aligned}}
其中,\Psi_{pq}(x,y) 是一个 ζ 内关于 (x,y) 的连续函数,它被称为矩的权核或基本集。下表 pq 通常表示函数 \Psi_{pq}(x,y) 中定义的坐标 x,y的次数。
在极坐标(r,\theta) 下的基函数需要按照图像空间的极坐标表示,因此图像的 (p+q) 阶矩函数的一般定义如下:
\begin{aligned} \Phi_{pq} = \iint\limits_\zeta r^{p+q+1} \Psi_{pq}(\theta) f(r,\theta) \mathrm{d}r \mathrm{d}\theta \qquad p,q = 0,1,2,\cdots \tag{2} \end{aligned}}