《电子技术应用》
您所在的位置:首页 > 其他 > 设计应用 > 基于统计分类的台标识别相关技术研究
基于统计分类的台标识别相关技术研究
来源:微型机与应用2012年第20期
于 静, 高 飞, 王沙沙, 温英新
(北京理工大学 信息与电子学院, 北京100081)
摘要: 针对电视台标所处背景的复杂性,现有的台标识别方法尚不能对各种台标进行有效识别,提出了一种基于统计分类的自动台标识别方法,采取先分类后识别等多种有效措施,可对复杂背景下的台标进行正确识别。通过对大量视频数据的验证证明,该方法识别精度高,具有较强的适应性。
Abstract:
Key words :

摘   要: 针对电视台标所处背景的复杂性,现有的台标识别方法尚不能对各种台标进行有效识别,提出了一种基于统计分类的自动台标识别方法,采取先分类后识别等多种有效措施,可对复杂背景下的台标进行正确识别。通过对大量视频数据的验证证明,该方法识别精度高,具有较强的适应性。
关键词: 台标识别; 统计分类; 小波重构迭代相减;奇异值分解

    电视台标是区分电视台的重要标识,台标有效识别将为视频收视行为统计提供有力支持,同时,也是对各个电视台进行自动视频分析、节目导向及内容检索的重要手段。目前,对台标识别已开展了广泛的研究,从各种不同侧面提出了一些台标识别的方法,在一定的条件下,这些方法可以较好地解决台标的正确识别[1-2]。
    由于台标的透明度不同,台标可分为半透明台标和不透明台标两类。半透明台标的像素点会随着复杂背景变化,如中央电视台和北京电视台的台标。而不透明台标的像素点不会随着背景改变,如湖南卫视、东方卫视等电视台的台标[2]。若对上述两种不同类型的台标采用同一种方法进行识别,很难获得令人满意的效果。
    本文通过对各种电视台标数据的分析,提出了一种基于统计分类的自动台标识别方法。该方法首先采用统计识别方法将不透明台标和半透明台标进行有效分类。在此基础上,针对两种类型台标的各自特点,采用不同的台标分割方法将台标进行正确分割。然后对分割的台标采用基于小波变换、奇异值分解的方法进行特征提取和识别。经大量实验数据验证,该方法识别精度高,具有较强的适应性。
1 台标统计分类
    为了实现台标的正确识别,首要任务是将上述两类台标进行有效分类。
    由于台标位置的时空不变性[3],而台标区域的背景变化相对较大,因此,可以采用基于多帧叠加及统计平均的方法使台标本身的信息获得增强,同时弱化背景信息。但是,由于两类台标的透明度不同,半透明台标的像素点会随背景变化而改变,不透明台标的像素点不会随着背景变化。因此,这种基于多帧叠加及统计平均的方法对于两类台标的增强程度是不同的。
    通过分析,构成半透明台标有效部分的像素点都是偏向于白色的,偏白色像素点的R、G、B 3个分量的值都是偏大的。而不透明台标主要由彩色像素点构成,基本不含有偏白色像素点或只含有一部分偏白色像素点,彩色像素点的R、G、B 3个分量不会同时取得较大值。因此,两类台标所含偏白色像素点的数量相差较大,半透明台标含有更多的偏白色像素点。这是两类台标的关键特性差异,基于这种差异可以对两类台标进行有效分类。
    本文对视频图像数据的处理是针对每一帧数据左上角包含所有电视台标的尽量小的公共区域。
    (1)对视频图像序列,连续采集200帧数据,将200帧视频图像数据分为10组,依序每隔10帧抽取1帧数据,组成1组,每一组中均含有在时间轴上不连续的20帧视频图像数据。
    (2)对于每一组视频数据,将20帧图像的R、G、B 3个分量分别相加再取统计平均,所得均值分别记为SRi、SGi、SBi,i=1,2,…,10。
    对于每一组在时间轴上不连续的20帧视频图像,台标本身不会随背景改变(不透明台标)或仅有较小变化(半透明台标),而背景部分有较大改变,因此,通过多帧叠加再取平均的方法可以加强台标本身,同时弱化背景。
    (3)经过上述处理,获得10组视频图像的R、G、B分量的均值SRi、SGi、SBi,i=1,2,…,10。设定经验阈值,用该阈值分别对所得的均值SRi、SGi、SBi进行判别,将小于阈值的像素点置为0,而大于等于阈值的像素点保持不变。
    (4)再将10组视频图像数据经过上述处理的SRi、SGi、SBi分别相加再取平均,得到均值SR、SG、SB,采用(3)中的经验阈值分别对其进行判别,将小于阈值的像素点置为0,而大于等于阈值的像素点保持不变。
    (5)这时SR、SG、SB中保留的非零像素点分别为视频图像R、G、B分量取值较大的像素点,综合利用经过处理的均值SR、SG、SB将这三者相加再取平均,所得均值记为M,设定门限T。M中大于门限T的像素点即认定为偏白的像素点,统计M中偏白像素点的数量,若大于某个阈值(通过反复试验求得最佳阈值),则认定这200帧视频图像的台标属于半透明台标,否则认为是不透明台标。台标统计分类方法的效果如图1所示。

    由此,通过统计分类的方法实现了半透明和不透明两类台标的有效分类。
2 台标特征识别
    上述预处理主要用于将半透明台标和不透明台标的有效分类。在分类的基础上,对每类台标分别采用针对该类台标自身特点的方法实现台标的正确分割,然后采用基于小波变换和奇异值分解相结合的方法实现台标的有效表示和正确识别。
    在台标特征识别中,仅对视频台标区域的灰度图像进行处理。
2.1 台标分割
2.1.1 不透明台标分割

    不透明台标各像素点与背景无关,仅受随机噪声干扰,取值基本不变,而背景部分变化较大。据此,采用迭代相减的方法去掉背景,将不透明台标的有效部分提取出来,实现台标的正确分割。具体做法是:
    (1) 在台标统计分类中,对于已经判定归为不透明台标一类的200帧视频图像序列进行分组,将这200帧视频的灰度图像分为20组,每相邻10帧视频图像数据组成1组。
    (2)将每一组视频中的10帧灰度图像数据相加再取统计平均,所得均值分别记为SNi,i=1,2,…,20。经统计平均后,可以加强不会随背景改变的台标本身。各组的SNi在台标区域的像素点取值相近,而在背景区域的像素点取值相差较大。据此,可以实现不透明台标的分割。
    (3)采用迭代相减的方法去除背景。首先,用SN2减去SN1,所得差值大于经验阈值D1的区域就判定为背景,将SN2中相应的区域置为0。这样,可以去掉一部分的背景。然后用SN3减去已去掉部分背景的SN2,并执行与SN2减去SN1后相同的操作,这样可以进一步地去掉背景。以此类推,直至完成。此时,已将判定为背景的区域全部置为0。最后,认定SN20保留的非零像素点构成的区域即为有效台标部分,至此,实现了不透明台标的有效分割。不透明台标分割方法的效果如图2所示。

2.1.2 半透明台标分割
    半透明台标各像素点的取值会随背景的变化而改变,针对这个特点,在分割半透明台标时,需要使用迭代相减和小波重构两种方法共同完成。具体做法是:
    (1)在台标统计分类中,对于已经判定归为半透明台标一类的200帧视频图像序列进行分组,将这200帧视频的灰度图像分为20组,每相邻10帧视频图像数据组成1组。
    (2)将每一组视频中的10帧灰度图像数据相加再取统计平均,所得均值分别记为STi,i=1,2,…,20。经统计平均后,可以加强会随背景变化有较小改变的台标本身。
    但是,由于半透明台标本身会随背景改变,这种基于多帧叠加和统计平均的方法对半透明台标的加强没有对不透明台标的效果好。因此,还需要对得到的STi进行小波重构,进一步加强半透明台标[4]。
    具体做法是:对STi进行小波变换,并对得到的低频小波系数进行倍乘操作,再用倍乘后的低频小波系数进行小波逆变换,实现小波重构。这样可以使半透明台标的有效部分得到进一步加强。经小波重构后的各组STi在台标区域的像素点取值相近,而在背景区域的像素点取值相差较大。据此,可以实现半透明台标的正确分割。
    (3)对于小波重构后的各组STi,采用迭代相减的方法去除背景。首先,用ST2减去ST1,所得差值大于经验阈值D2的区域就判定为背景,将ST2中相应的区域置为0。这样,可以去掉一部分的背景。然后用ST3减去已去掉部分背景的ST2,并执行与ST2减去ST1后相同的操作,这样可以进一步去掉背景。以此类推,直至完成。此时,已将判定为背景的区域全部置为0。最后,认定ST20保留的非零像素点构成的区域即为有效台标部分,至此,实现了半透明台标的正确分割。半透明台标分割方法的效果如图3所示。

 

 

2.2 台标特征提取及识别
    以上已经分别完成两类台标的分割,接下来就要提取台标的有效特征并进行识别。在此,以不透明台标为例,半透明台标的特征提取和识别采用相同的方法。
     首先对分割出的台标进行小波变换,得到小波系数的低频分量。该分量集中反映了台标的主要特征,同时又可以起到去除噪声和减少后续处理数据量的作用。
     小波系数的低频部分可以从多种层面反映台标的特征,如通常采用的方差、中心矩等。本文采用了一种新的方法,即对小波低频系数矩阵进行奇异值分解(SVD)[5]。
  在奇异值分解理论中,任何m×n阶矩阵M(假定m>n),秩为r(r≤n),则存在m×m正交阵U和n×n正交阵V,使得:
  

     不同台标的小波低频系数矩阵的特征值存有较大差异,因此,可将由式(2)得到的特征参数向量用于区分台标。
    为了完成台标的识别,本研究中预先建有不透明类台标的知识库S1(半透明类台标预先建有知识库S2,S1与S2独立),台标知识库中存有台标特征参数向量、电视台名称等相关知识。计算待识别台标与台标库S1中各台标模板之间差值的2-范数,最小者即为候选台标。
    在此,待识别台标只与本类台标知识库中的各台标模板相比较,而不需与所有台标模板进行比较,这样可以减少台标识别的计算量。
3 实验结果及分析
    本文共采集中央新闻、北京卫视、东方卫视、天津卫视和湖南卫视等5个频道,每个频道30个样本,共计150个样本,每个样本时长为8 s(视频的帧速率为25帧/s),样本视频图像大小为640×480。统一提取视频帧图像左上角包含台标、大小为50×120的子图作为分析对象。其中,中央新闻、北京卫视两个频道的台标属于半透明台标,东方卫视、天津卫视、湖南卫视三个频道的台标属于不透明台标。台标识别算法实验结果如表1所示。
    从表1中可以看出,本文算法对台标的正确识别率较高,特别是对半透明台标的识别精度可以达到100%。实验中,影响不透明台标识别精度的原因是:每个待识别视频样本时长仅为8 s,当视频样本台标区域的背景几乎不变时,本文算法不能将不透明台标的有效部分从背景中提取出来,也就不能正确识别台标。

    电视台标是区分电视台的重要标识,自动台标识别技术是对各个电视台进行自动视频分析、节目导向及内容检索的重要手段。本文通过研究分析半透明和不透明两类台标的共性和两者的差异性,首先通过统计分类的方法将两类台标分开,再针对两类台标各自的特点,分别采用不同的方法实现每类台标的分割,最后对分割得到的台标用基于小波变换和奇异值分解的方法完成台标识别。实验表明,该算法识别精度较高、适应性较强,具有工程应用价值,但对不透明台标的识别精度有待进一步提高。在今后的研究中,将进一步改进不透明台标的分割方法,提高识别精度。
参考文献
[1] 周献中,史迎春,王韬.基于HSV颜色空间加权Hu不变矩的台标识别[J].南京理工大学学报,2005,29(3):363-367.
[2] 张博洋,曾向荣,刘振中.基于神经网络的静态台标识别系统设计与实现[J].计算机仿真,2009,26(1):212-215.
[3] TEKALP A M. 数字视频处理[M].崔之祐,江春,陈丽鑫,译.北京:电子工业出版社,1998.
[4] CASTLEMAN K R. 数字图像处理[M].朱志刚,林学訚,石定机,等译.北京:电子工业出版社,1998.
[5] 张显全,李国祥,秦芳远.基于小波变换和奇异值分解的剪纸纹样识别[J].计算机工程与设计,2010,31(10):2280-2282,2286.

此内容为AET网站原创,未经授权禁止转载。