基于ROI区域强分辨力HOG特征的视频行人检测-AET-电子技术应用

基于ROI区域强分辨力HOG特征的视频行人检测

来源：微型机与应用2013年第7期

张璐，陈淑荣

（上海海事大学信息工程学院，上海 201306）

摘要： 针对传统梯度方向直方图（HOG）行人检测系统中检测窗扫描区域过大、HOG特征维度大而引起的检测速度慢问题，提出了改进的视频行人检测算法。通过运动信息提取感兴趣（ROI）目标区域，利用Fisher准则和多尺度特性选取具有强分辨力的行人HOG特征从而降低特征维数，结合支持向量机（SVM）检测行人。实验结果表明，本文方法在保证视频行人检测的准确率的同时，有效地提高了行人检测的速率。

关键词： 计算机视觉图像处理行人检测感兴趣区域梯度方向直方图 Fisher准则

Abstract：

Key words :

　行人检测是计算机视觉和模式识别领域中的研究热点，在视频监控中有广泛的应用。目前，用于行人检测的方法主要分为3类：（1）基于运动信息的方法[1-2]，根据行人运动信息（如步态）实现行人检测，实时性好但只限于运动行人；（2）基于先验知识建模的方法[3]，利用已知先验知识构建人体模板和待测目标进行匹配，但模板的初始参数难以获取；（3）基于特征统计分类的方法[4-9]，根据训练数据获取有效分类器对输入检测窗口进行检测，实现简单且检测效果较好，是目前静态图像行人检测的主流方法，但对视频行人检测速度较慢。因此，如何保证视频行人检测的准确率，并提高检测速度是一个急需解决的问题。
1 本文行人检测方法
　视频录像中行人的不同姿势、复杂的背景变化对算法的检测准确率和检测速度都提出了严格要求。本文提出利用视频中的运动信息获取ROI区域，结合Fisher准则挑选强分辨力行人HOG特征，并结合SVM分类器检测行人。其中，训练部分采用正负样本库提取强分辨力HOG行人特征，并通过SVM训练得到强分辨力HOG特征的行人分类器。检测时利用帧间信息获得ROI区域，通过多层次缩放ROI区域获取所有检测窗，并利用强分辨力行人HOG特征来表征检测窗中行人，通过训练好的分类器实现对视频中行人的检测。该算法框架如图1所示。
1.1 视频图像ROI目标区域提取
　视频帧图像中存在大量的非人区域，全局扫描需要很多冗余计算。本文采用三帧差分法获取运动目标前景，进行二值化处理、形态学处理和前景块扩展，获取ROI目标区域。具体实现步骤如下。

其中，ｕ是0~1的一个值，w、h分别表示前景块的宽、高。
（5）标记扩展后的行人目标前景块集合，构建ROI区域以进行后续的特征提取和检测。ROI目标区域提取如图2所示。

1.2 强分辨力行人特征提取
1.2.1 多尺度HOG特征
　HOG特征是通过计算局部区域的梯度方向直方图描述目标形状特征，对光照变化和小量的偏移不敏感。DALAL N提出的基本HOG是在64×128的检测窗内提取105个16×16等大小的Block特征块，利用这些特征块构成描述符来训练和检测行人。
　等大小的基本HOG特征块对描述行人较大的部位（如头部、身体等）的整体信息能力有限，因此本文构建HOG特征时采用了多尺度[6]方法，对于64×128检测窗，Block块的大小选取依次从16×16到64×128，宽高比（w∶h）分别取1∶1、1∶2和2∶1，共获得452个不同尺度的Block块。
　在特征块提取过程中，为避免特征块交叠而引起的重复计算，引入“积分图[6]”思想，每个像素点的特征由9维向量表示，即：

2 实验及结果分析
　本文实验在MATLAB2008a上实现，计算机环境配置为3 GHz CPU和2 GB内存。采用的数据来源于INRIA行人数据库和PETS2006视频库。在提取强分辨力行人特征时，分别将INRIA样本库中的1 000个正、负样本用于训练和检测，并利用强分辨力HOG行人特征分类器对PETS2006视频库的视频行人进行检测。实验采用libsvm工具包，选用线性SVM训练分类器。
　文中通过对单尺度基本HOG扩展，得到Block数为452的多尺度HOG，并利用Fisher准则分别对不同尺度HOG进行降维处理，获得不同维数的强分辨力特征，结合SVM分类器验证不同尺度、不同维度的特征检测效果。实验结果如表1所示。

　实验表明，扩展后的多尺度HOG特征，SVM分类准确率显著提高；相同特征维数下（表中只列出Block数为105、30、10的特征），多尺度特征比单尺度特征具有更高的检测准确率且降维幅度越大，多尺度特征优势越明显。
　文中采用设定最低检测率来提高检测速率，利用SVM分类的效果来选择最佳分辨力特征。如表1所示，在多尺度下，当选取特征块数为10时，保证了行人检测的准确率，提取、检测的速率比基本HOG都有所提高，检测速率提高了9.7倍。本文取多尺度下Block数为10的特征集作为f′select，训练分类器进行行人检测和分类。
　实验通过ROI目标区域提取，大大降低了检测窗口数量，并与传统HOG全局扫描算法、Adaboost[3，8]算法作比较。由于本文算法ROI目标区域大小直接受行人数量、大小影响，实验选取统一的单行人视频序列进行测试，帧像素大小为720×480。实验结果如表2所示。

　参考文献[3，8]提到的Adaboost算法是利用一系列弱分类器组合强分类器，根据每个样本分类结果修改权值进行下一层分类训练，训练分类器时依次对每个特征集单独训练，耗费时间很长。本文算法采用Fisher准则提取的强分辨力行人特征训练分类器，特征整体一次投影实现一次分类，具有优势。
实验证明，本文算法比全局扫描减少了检测窗数量，显著提高了检测的速率；在保证准确率的前提下改进单尺度HOG，利用多尺度降维HOG进一步提高行人的检测速率。本文算法不仅大幅度提高了行人检测的速率，而且保证了视频行人检测准确率在90%以上。
　本文针对传统HOG特征在行人检测中存在高维度计算的问题，提出一种利用视频运动信息和强分辨力行人HOG特征相结合的视频行人检测算法。利用INRIA行人库和PETS2006视频库验证了算法的有效性。后续将针对夜间、雨天等复杂背景，进一步验证和改进算法。
参考文献
[1] 刘鑫，刘辉，强振平，等.混合高斯模型和帧间差分相融合的自适应背景模型[J].中国图象图形学报，2008，4：729-734.
[2] 王成亮，周佳，黄晟.基于高斯混合模型与PCA_HOG的快速运动人体检测[J].计算机应用研究，2012，29（6）：2156-2160.
[3] 周晨卉，王生进，丁晓青.基于局部特征级联分类器和模板匹配的行人检测[J].中国图象图形学报，2010，15（5）：824-829.
[4] DALAL N， TRIGGS B. Histograms of oriented gradients for human detection[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition， CVPR2005， 2005，1：886-893.
[5] 孙昀，刘富强，李志鹏.基于稳定区域梯度直方图的行人检测方法[J].计算机辅助设计图形学报，2012，24（3）：372-377.
[6] 黄茜，顾杰锋，杨文亮.基于梯度向量直方图的行人检测[J].科学技术与工程，2009（13）：3646-3651.
[7] 姚雪琴，李晓华，周激流.基于边缘对称行和HOG的行人检测方法[J].人工智能及识别技术，2012，38（5）：179-182.
[8] 种衍文，匡湖林，李清泉.一种基于多特征和机器学习的分级行人检测方法[J].自动化学报.2012，38（3）：375-381.

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容