《电子技术应用》

一种基于统计信息的Snake运动目标跟踪算法

作者:刘 涛,张有志
2008/5/5 18:00:20

  摘 要: 传统Snake模型采用基于轮廓的图像能,分割结果受图像噪声和强边界的影响较大。本文在Snake模型中引入区域统计信息,并对弹性能做了改进,克服了仅用边界信息描述目标轮廓的不足。把改进的Snake模型用于运动目标" title="运动目标">运动目标的跟踪,提高了跟踪的准确性。

  关键词: 运动目标跟踪" title="目标跟踪">目标跟踪 Snake模型 主动轮廓模型 区域统计特征

 

  运动目标的分割和跟踪技术一直是图像处理和计算机视觉领域重要的基础性课题,其研究成果已广泛应用在视频分割与压缩、智能交通以及生物医学等领域。在目前众多的视频对象跟踪技术中,有一类是基于主动轮廓线模型的算法。

  主动轮廓模型也称为Snake模型[1],最初是作为一种图像分割" title="图像分割">图像分割算法提出来的。按照轮廓线表示方法的不同,Snake模型可分为离散Snake模型和Geodesic主动轮廓模型两类。本文针对离散Snake模型存在的问题提出了改进方法。

  传统的Snake模型存在的不足主要有:轮廓线的初始位置必须接近目标边缘;结果容易受噪声影响;算法计算量大等。针对这些问题,研究者提出了许多改进模型,如通过在模型中引入气球力[2]、梯度矢量流[3],扩大了模型作用的有效范围,但是曲线受噪声影响仍很大;Jim Ivins等人[4]将图像数据统计特征引入Snake模型,提出统计蛇模型(也称为主动区域模型),在一定程度上提高了分割纹理不同区域的能力,但是该模型使用时若图像任意像素的灰度服从统一的高斯分布,适用范围将受到很大限制。

  依据最大似然准则,本文在传统Snake模型中引入了新的区域能量,对弹性能亦做了修改,并用动态规划法实现目标的分割。对运动目标跟踪时,将Snake模型与对目标的运动估计相结合,以提高跟踪的准确性。通过对比实验说明,本文算法能减少噪声和强边界对轮廓线的干扰,提高了分割和跟踪的有效性。

1 Snake模型原理

  主动轮廓线是一条有能量的样条曲线,可用若干控制点组成的集合来表示。通过减少曲线总能量,使其向特征位置靠近,以实现对目标的分割。Kass等人用函数Esnake(v(s))表示曲线总能量[1]。其中,s为空间参数,函数v(s)=v(x(s),y(s))表示从参数域s∈[0,1)到图像表面曲线的映射。曲线总能量定义为:

  其中,α(s)、β(s)为各项权值。Eext称为外部能量,用于引导曲线演化。Eext由两部分组成,即Eext(v)=Eimage(v)+Econ(v)。图像能Eimage(v)表示目标轮廓,可以定义为Eimage(v)=-γ(s)▽Gσ*I(v)。其中,γ(s)为各项权值,I表示图像,Gσ标准差" title="标准差">标准差为σ的二维高斯函数。当σ较小时,检测到的边缘位置精度高、细节变化多[5]。Econ(v)则产生一种外部控制力,具体形式可根据需要构造。

2 基于区域统计信息的Snake模型

  传统Snake模型主要利用边界信息引导轮廓线的演化,曲线受噪声和强边界影响大。针对该问题,本文构造了一种新的区域能量Eregion,并对弹性能量的形式做了改进。 2.1 区域能量的定义

  区域能量是图像能的一种,为与Eimage相区别,将其用Eregion表示。首先,假定可用域值化方法把图像或其一部分Ω分成感兴趣区域O和背景C两个区域,同时满足Ω=O∪C,O∩C=Φ,用μo、μC、σo、σC分别表示各部分的灰度均值和标准差,X表示Ω内任意像素。那么,Ω一旦给定,先验概率P(O)、P(C)就成为常数。根据最大似然函数准则,当成立时,可以按灰度将像素X归于区域O,反之则将其归入背景C中。由此定义判决函数分别表示为

  do(X)=-2[lnP(X|O)-lnP(O)]和dC(X)=-2[lnP(X|C)-lnP(C)]。详细证明可参阅文献[6]

  据此,可定义区域能量为:

  若把轮廓线选在目标附近,那么Ω只需要考虑目标边缘附近的区域就可以了,而且最终轮廓线将收敛到目标与背景的边界上,所以可以认为P(O)≈P(C)。把(4)、(5)式带入(3)式,整理得:

  通过调整λo、λC的取值可以减小(6)式由于忽略常数项引起的误差。容易知道,当Eregion趋于0时,控制点处于稳定状态。

2.2 弹性能的改进

  设控制点总数为N,且第N个控制点序号可以为0,在Kass Snake模型中,离散化的弹性能可用样条曲线各段长度表示,即:

  其中i∈[1,N]。在曲线演化过程中,该能量只有使控制点相互靠近的作用,它的不足是非常明显的。针对该问题,Williams等人[7]将弹性能定义为:

 

  当控制点间距差别不大时,弹性力达到平衡,即控制点最终趋于等间距分布。这种方法避免了控制点的过度集中,但对等间距的要求过于严格。在实际应用中,控制点常会落入某一纹理一致的区域内,该部分曲线可能因为弹性能与图像能趋于0而达到稳定。为解决该问题,可以对弹性能做适当改进,使目标内的控制点在弹性力作用下相互远离,而背景中的控制点相互靠近。

  据此原则,在Willimas 弹性能中引入系数λi,并定义为:

 

3 实验结果与讨论

  为满足Eimage的使用条件,只选择目标附近的区域作为背景。对内部能量Eint、图像能Eimage、区域能Eregion做归一化处理,可得:

 

  将模型用于有噪声的灰度图像的分割,传统Snake模型与本文算法图像分割结果的比较如图1所示,其中图像大小为256×256。噪声的存在使目标边界并不明显,同时待分割的目标由平均灰度不同的两部分组成,而右侧部分并不规则,仅用图像能很难把它描述清楚。图1(a)为原始图像和人为设定的初始轮廓。图1(b)和图1(c)为相同条件下分别用传统Snake模型与本文改进模型得到的分割结果。两图比较可以明显看出,后者能更准确地分割出目标轮廓。图1(d)是两种模型迭代前后轮廓线总能量的差值曲线,它可以用迭代前轮廓线总能量减去一次迭代后轮廓线总能量得到。其中带点的折线对应于传统Snake模型,另一条折线则对应于本文的改进模型,并规定轮廓线总能量的起始值为5。从图中可以看出,传统Snake模型尽管收敛很快,只需12次迭代即可,但在第12次迭代以后,本文算法的能量变化产生的振荡幅度小于传统Snake,且第17次迭代后的能量变化趋近于0。这说明,此时绝大多数的控制点处在更稳定的状态,所得分割结果也更准确。

 

  对室外监控场景图像序列的运动目标进行跟踪。其中,每帧图像的大小为512×512,图2(a1)~(a2)、(b1)~(b2)、(c1)~(c2)、(d1)~(d2)分别是序列的第1、20、25、30帧的局部。此序列中被跟踪目标通过的背景区域较复杂,且相邻帧间目标的位移较大。为提高跟踪的准确性,由当前帧的分割结果与帧间运动矢量相叠加作为下一帧目标的初始轮廓。图2(a1)~(d1)是基于传统Snake模型的跟踪结果,(a2)~(d2)则是在相同条件下基于本文算法所得结果。可以看出,前20帧中,两种算法所得结果相差不大。但20帧后,基于传统Snake的跟踪结果明显受到强边界的影响而被吸引到目标内部,如图2(c1)、(d1)所示。而基于本文Snake模型得到的曲线却能较好地反映目标轮廓,如图2(c2)、(d2)所示。因此,基于本文Snake模型的跟踪算法" title="跟踪算法">跟踪算法可以在很大程度上减少来自背景和强边界的干扰,跟踪结果更准确、更稳定。

  本文在离散Snake模型中引入一种区域能量,提出了一种对原有弹性能的改进方法。从实验结果的比较可以看出,本文算法减少了目标内外局部干扰对轮廓线整体性能的影响,提高了跟踪的准确性。而其不足之处在于:首先,区域的统计特性的估计值是否准确对结果有很大的影响,因此对它们的估计要尽量准确;其次,算法本身的计算量大,运行时间长。所以进一步提高Snake模型跟踪的有效性和运算效率将是下一步研究的重点。

参考文献

1 Kass M,Witkin A,Terzopoulous D.Snakes:active contour models[A].In:Processing of first international conference on computer vision[C],London,England,1987:259~268

2 Cohen L D.On active contour models and balloons[J].CVGIP Image Understanding,1991;53(2):221~218

3 Xu C,Prince J L.Snakes:shapes and gradient vector flow[J]. IEEE Transactions on Imaging Processing,1998;7(3):359~369

4 Ivins J,Porrill J.Active region models for segmenting medical images.In:IEEE ICIP,1994

5 章毓晋.图像分割[M].北京:科学出版社,2001

6 Bow S T.Pattern recognition and image processing[M].New York:Marcel Dekker Inc,2002

7 Williams D J,Shah M.A fast algorithm for active contours and curvature estimation[J].CVGIP:Image Understanding,1992;55(1):14~26

继续阅读>>