YOLOv3网络在车标检测中的应用-AET-电子技术应用

YOLOv3网络在车标检测中的应用

2020年电子技术应用第9期

王林，黄三丽

西安理工大学自动化与信息工程学院，陕西西安710048

摘要： 针对车标检测存在检测时间长、检测率低、可识别类型少的问题，提出一种采用You Only Look Once(YOLOv3)网络的方法。为了使该网络适用于小目标的车标检测，将目标特征提取结构Darknet-53换成Darknet-19，并且将多尺度预测层数减少为两层以减少网络参数数量。同时，为了增大车标在图像中所占比例，让卷积神经网络能学习更多的车标特征，采用将车辆从图像中裁剪后进行人工标注的方法，构建了一个包含46类车标的数据集(VLDS-46)。实验结果表明，采用该模型进行车标检测时能在实现高检测率的同时达到实时性要求，检测平均耗时为9 ms。

关键词： 车标检测卷积神经网络数据集 Darknet-19

中图分类号： TN98
文献标识码： A
DOI：10.16157/j.issn.0258-7998.200067
中文引用格式： 王林，黄三丽. YOLOv3网络在车标检测中的应用[J].电子技术应用，2020，46(9)：34-37，42.
英文引用格式： Wang Lin，Huang Sanli. Application of YOLOv3 network in vehicle logo detection[J]. Application of Electronic Technique，2020，46(9)：34-37，42.

Application of YOLOv3 network in vehicle logo detection

Wang Lin，Huang Sanli

School of Automation and Information Engineering，Xi′an University of Technology，Xi′an 710048，China

Abstract： Aiming at the problem that the vehicle logo detection has long detection time, low detection rate and few identifiable types, a method using You Only Look Once(YOLOv3) network is proposed. In order to make the network suitable for vehicle target detection of small targets, the target feature extraction structure Darknet-53 is replaced with Darknet-19 and the multi-scale prediction layer is reduced to two layers to reduce the number of network parameters. At the same time, in order to increase the proportion of the car logo in the image and let the convolutional neural network can learn more car logo features, this paper adopts a method of cutting the vehicle from the image and manually marking it, constructing a class of 46 vehicles Data set(VLDS-46). The experimental results show that when the model is used for vehicle logo detection, the real-time requirement can be achieved while achieving high detection rate, and the average detection time is 9 ms.

Key words : vehicle logo detection；convolutional neural network；data set；Darknet-19

0 引言

近年来，随着人工智能技术的不断发展，其被广泛用于公共安全、教育、人机交互等领域，例如：人脸检测^[1]、图像分类^[2]、图像分割等。同样的车标检测技术对于完善智能交通具有重要作用，能够辅助实现车辆信息的确认。21世纪以来，随着国民经济快速发展，汽车数量在我国的增长速度越来越快。汽车数量过多带来交通压力的同时也会带来其他问题：套牌车、假车牌事件频频发生。这些事件的发生意味着仅仅通过车牌来确认车辆准确信息将受到阻碍。同车牌一样，车标也是车辆的一个重要属性，在结合车牌信息后，就能更准确地确认车辆信息。国内外学者对车标检测采用了不同的方法进行研究。一般而言，分为传统机器学习方法和卷积神经网络方法。

采用传统机器学习方法在进行车标检测时繁琐，需要分为两个独立的步骤：首先进行车标定位，然后进行车标识别。文献[3]-[4]采用传统机器学习方法在进行车标定位和识别过程中都需要由专业人员人工设计特定特征，但是这些特征对于光照、阴影、车身倾斜等的变化所表现出来的鲁棒性不强，在应用于实际场景下会出现低检测率和识别率问题。针对传统机器学习方法的不足，卷积神经网络方法应运而生。

早在20世纪80年代末期,卷积神经网络^[5]技术就已经应用于视觉任务中，但由于当时设备的运算能力不强和数据资源的不足，这一技术并没有得到研究人员的广泛研究和长足的发展。后来得益于GPU(Graphics Processing Unit)强大的计算能力和互联网上丰富的数据资源，卷积神经网络技术得到了进一步的发展，而且也取得了突破性的进展。卷积神经网络一般包含卷积层、池化层、全连接层等。借助于卷积神经网络的强表达能力，不需要人工设计特征，在网络学习车标特征后就能自动进行车标的定位以及分类。2014年，GIRSHICK R等^[6]人第一次将卷积神经网络应用于目标检测上并且获得了比只使用方向梯度直方图^[7](Histogram of Oriented Gradient，HOG)特征更高的准确率，该网络称为区域卷积神经网络(Region Convlutional Network，R-CNN)。但该网络存在耗时久的弊端，伴随着对该网络框架的不断改进，其目标检测的精度不断提高，运行时间也不断减少。2015年，HE K^[8]等人通过改进R-CNN网络缩短其检测时间，但其最大帧率也只能达到5FPS。这对于帧率最小为25FPS的监控视频来说是远远不够的。为了在准确率和时间上得到均衡，YOLO网络^[9]得到了应用，它将物体检测作为回归问题来求解，在输入图像后经过一次前馈就能得到图像中所有待检测物体的位置和其所属的类别以及相应的置信度，进行目标检测时耗时少。

目前采用卷积神经网络进行车标检测时遇到两个问题：(1)公开的车标数据集少且包含的车标种类少^[10]；(2)采用卷积神经网络方法时参数多，运行耗时。因此，本文提出的采用改进的YOLOv3^[11]网络进行车标检测主要有以下两个贡献：(1)替换YOLOv3中的Darknet-53为层数少的Darknet-19[12]结构，减少运算量进而减少车标检测时间；(2)构建了一个包含46类车标的数据集。

本文详细内容请下载:http://www.chinaaet.com/resource/share/2000002976

作者信息:

王林，黄三丽

(西安理工大学自动化与信息工程学院，陕西西安710048)

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容