《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > 基于非参数化特征提取的神经网络识别
基于非参数化特征提取的神经网络识别
曾 坤 桑 农
摘要: 本文采用非参数化的特征提取技术提取样本的特征,再用模块化的神经网络的方法进行训练识别,取得了较好的实验效果。
Abstract:
Key words :

  摘  要: 本文采用非参数化的特征提取技术提取样本的特征,再用模块化的神经网络的方法进行训练识别,取得了较好的实验效果。
  关键词: 特征提取  神经网络  目标识别

   传统的特征提取方法建立在目标分割的基础上,通过分割获得目标的形状信息,并与已知的待识别目标的形状特征进行比较,实现目标分类。目标的形状特征通常由一组参数来描述,如不变矩、Fourier描绘子、各线特征的起点和终点、各点特征(角点、形殊点)的位置等。故传统的特征提取方法可视作参数化方法。但由于目标分割问题自身的内在复杂性,目前还不存在通用的、理想的目标分割方法。近年来,人们的注意力较多地集中于所谓的无分割(Segmentation Free)目标识别,即利用目标的灰度信息提取某些统计特征(如全局的或局部的灰度均值、灰度标准差等),构成目标的特征,并将其作为神经网络的输入,对神经网络进行训练。训练完成后的神经网络即可用于目标识别,这是一类非参数化的特征提取技术。具体实现时,可供采用的特征提取方法很多,简单的如进行方向投影或提取方向边缘特征等,复杂的如采用各种局部或全局变换等。本文重点研究了一种非参数化的特征提取方法——感兴趣算子图像特征提取方法。
1  感兴趣算子特征提取方法
  感兴趣算子(Interest Operator)提取的是图像在其水平、垂直和二个对角线方向上的灰度方差。图1为感兴趣算子特征提取示意图。

 


  例如对一幅大小为50×60象素的图像采用上面的方法进行特征提取,则选取的图像子块像素大小为5×5。因此可以将原图像划分成无重叠的120个子块,然后针对每个图像子块提取图像的感兴趣特征向量。
2  模块化的神经网络
  模块化神经网络由若干独立训练的子网络组成,每一子网络分别针对训练样本集的某一子集进行分类识别,通过组合各子网络的分类决策确定最终的识别结果。训练样本集各子集的划分采用了数据分组技术,即将样本根据一定的相似性准则划分为多组。如此分组后,各网络仅需解决一个更为简单的分类问题,因此可提高分类识别概率。
2.1 基于特征分解的模块化神经网络
  基于特征分解的模块化神经网络按照某种规则将图像特征分成几个不同的特征组。每个特征组都用一个独立的神经网络来训练识别,然后由一个融合网络将各独立神经网络的输出结果综合得到最后的识别结果。这种算法的优点是:通过分组,每个用于识别的神经网络只需要处理某一部分特征而不是全部,从而减少了单个网络的自由参数,降低了问题的复杂度。
2.2 基于图像子块的特征分组神经网络
  基于图像子块的特征分组神经网络算法的结构框图如图2所示。

  该算法的实现包括以下几个步骤:
  (1)将原始图像按照某种规则分成若干图像子块,各个图像子块间可以有交叉也可以无交叉。图3和图4分别为有交叉和无交叉图像分块的示意图。

  (2)对每一个图像子块进行特征提取,得到其相应的图像特征。本文选用了感兴趣算子的特征提取方法。
  (3)对步骤(2)经过特征提取所得到的图像特征向量进行特征选择,以去除特征向量间的冗余特征和选出具有更强分类识别能力的特征,从而降低特征维数,减小识别算法中神经网络的网络规模。
  (4)对每幅子图分别用一个单独的BP网络对其进行训练或识别。
  (5)将各个独立BP网络的输出结果送到一个融合网络中进行融合从而得到最终判识结果。
  基于图像子块的特征分组神经网络除了可以降低问题的复杂性外,还具有一定的抗局部遮挡能力。由于一些人为的或非人为的因素,目标图像可能会受到局部遮挡的影响。由于局部遮挡本身的复杂性和其对目标遮挡部位的不可预测性,使得抗遮挡成为一个相对困难的课题。基于图像子块的特征分组策略具有一定的抗局部遮挡能力。
  设原图像在长度和宽度方向分别被等分为X和Y份,于是可以得到X×Y个子块图像。若局部遮挡处于第(i,j)个子块上,则只有该子块受到影响并导致与它对应的神经网络进行错误判识的可能性增大。但是由于其他子块及对应神经网络的判识并未受到遮挡影响,因此至少可以得到X×Y-1个网络的正确输出。经过融合网络,最终可以消除对第(i,j)个子块图像的错误判识的影响而得到正确的识别结果,达到抗遮挡的效果。当然,实际应用中局部遮挡可能会存在于不止一个子块图像中,但只要这些子块图像的数量占总子块图像数的比重相对较小,这种特征分组神经网络识别策略就可以表现出很好的抗局部遮挡性能。
3  实验结果及其分析
  实验中训练样本取kh-11、kh-12、lacrosses三类卫星的三个谱段(CCD:可见光,MIDDLE:中波,LONG:长波)图像作为试验用的样本。
  (1)训练样本:取每类不同谱段的图像001、005、009、L、057共15幅图像。如果三个谱段的图像一起训练,则训练样本个数为15×9=135;如果只有单谱段图像参加训练,则训练样本个数为:15×3=45。
  (2)识别样本:取每类不同谱段的图像003、007、0011、L、059以及060、061、L、072总共30幅图像。如果三个谱段的图像一起识别,则识别样本个数为30×9=270;如果只有单谱段图像参加识别,则识别样本个数为30×3=90。
  表1给出了不同分辨率情况下的正确识别率。其中,All组实验表示对每类三个谱段的卫星图像进行实验,CCD、MIDDLE和LONG组实验分别表示对可见光谱段、中波红外图像和长波红外图像进行实验。CCD为可见光图像,MIDDLE为中波图像,LONG为长波图像。

 


  研究中还用最小距离分类器对提取的不同目标的参数化特征进行了实验,以便观察其与神经网络方法的性能差异。在实验中,三类目标的图片各为3×72=216幅,用奇数图作为训练样本,对偶数图进行识别。表2显示了在三组不同分辨率下选择不同特征集得到的识别结果。


  从实验中可以发现,常规分类方法性能不稳定,而且其识别率与神经网络方法相比要低很多。
参考文献
1   Choi S M.A segmentation-free recognition of two touching
     numerals using neural network.In:Proceedings of the Fifth
     International Conference on Document Analysis and
     Recognition,1999
2   Ozdil M A,Vural F T Y.Optical character recognition
     without segmentation.In:Proceedings of the Fourth Inter-
     national Conference on Document Analysis and Recogni-
     tion,1997
3   Rocha J,Pavlidis T.Character recognition without segmen-
     tation.IEEE Transactions on,Pattern Analysis and
     Machine Intelligence,1995;17:903
4   Cai C,Shi Z.A modular neural network architecture with
     approximation capability and its applications. The Second
     IEEE International Conference on Cognitive Informatics,
     2003
5   Wang L C,Der S Z,Nasrabadi N M.Automatic target
     recognition using a feature-decomposition and data-
     decomposition modular neural network.IEEE Transactions
     on Image Processing,1998;7:1113
 

此内容为AET网站原创,未经授权禁止转载。