基于改进LeNet-5的形状类似物体识别方法-AET-电子技术应用

基于改进LeNet-5的形状类似物体识别方法

《信息技术与网络安全》2020年第6期

郑睿1，2，余童1，2，程龙阅1

1.安徽师范大学物理与电子信息学院，安徽芜湖241002； 2.安徽省智能机器人信息融合与控制工程实验室，安徽芜湖241000

摘要： 针对深度学习在对外形类似物体的识别上存在着识别精度低、耗时长等问题，提出基于改进的LeNet-5的识别方法。在传统LeNet-5网络基础上，将卷积层变为双层非对称卷积使网络有更好的特征提取能力；通过批量归一化提高网络泛化能力；采用全局平均池化替代原Flatten层，用于克服传统全连接层参数多、耗时长的缺点；通过对训练集进行增广增加训练样本。实验结果表明，改进LeNet-5网络的训练精度达到91%，识别形状类似物体的精度为87%，且能在较少迭代次数内收敛，这些指标均显著优于原网络。

关键词： LeNet-5网络图像识别非对称卷积批量归一化最大平均池化

中图分类号： TP183
文献标识码： A
DOI： 10.19358/j.issn.2096-5133.2020.06.006
引用格式：郑睿，余童，程龙阅. 基于改进LeNet-5的形状类似物体识别方法[J].信息技术与网络安全，2020，39(6)：31-37，43.

Recognition method of similar-shaped objects based on improved LeNet-5

Zheng Rui1，2，Yu Tong1，2，Cheng Longyue1

1.College of Physics and Electronic Information，Anhui Normal University，Wuhu 241002，China； 2.Anhui Province Engineering Laboratory of Intelligent Robot′s Information Fusion and Control，Wuhu 241000，China

Abstract： Aiming at the problems of low recognition accuracy and long time-consuming in the recognition of similar shape objects by deep learning, a recognition method based on improved LeNet-5 is proposed. Based on the traditional LeNet-5 network, changing the convolutional layer into a double-layer asymmetric convolution makes the network have better feature extraction capabilities; the generalization ability of the network is improved by batch normalization; the original Flatten layer is replaced by global average pooling，which is used to overcome the shortcomings of the traditional fully-connected layer with many parameters and long time-consuming; the training sample is increased by augmenting the training set. Experimental results show that the training accuracy of the improved LeNet-5 network reaches 91%, the accuracy of identifying objects with similar shapes is 87%, and it can converge within a small number of iterations. These indicators are significantly better than the original network.

Key words : LeNet-5 network；image recognition；asymmetric convolution；batch normalization；maximum average pooling

当前，基于视觉的智能机器人已经应用于各领域中。当机器人面临需要抓取形状类似、硬度不同的物体时，智能机器人应选择不同的抓取力。因此，通过视觉识别出这类物体具有较高实用价值。利用深度学习对图像进行识别是较为高效的方法，国内外相关研究已经在车辆及车道线检测、人脸识别、手写体识别等领域取得较多的成果。

近年来，针对形状类似物体的识别也取得了一定的成果。张雪芹等人利用深度学习AlexNet网络实现了对多种类植物图片进行分类识别。林思思等提出融合深度特征和人工特征的花卉图像特征提取方法，并在此基础上实现花卉图像的分类。西南交通大学秦放提出基于深度学习的昆虫图像识别研究，扩充了昆虫样本集，基于昆虫图像识别的任务需求和样本集，从网络和训练两个方面进行改进。张立超等人利用LeNet-5网络对两种品种的苹果进行分类识别，在两种苹果的分类中取得不错的效果。但大型的神经网络一般通过加深网络深度获得高精度的识别率，其结构较为复杂，运算量大，无法满足快速识别的要求。

因此，本文选择LeNet-5网络作为研究对象，由于LeNet-5网络结构较为简单，运算量较小，对硬件配置要求低，能够在满足网络轻量化的前提下对形状类似、硬度不同的物体实现快速识别。传统LeNet-5网络在识别精度上尚有不足。为了能够提高识别精度且尽可能地减少运算量，本文将传统卷积核拆分为非对称卷积核以缩短计算时间；在网络中间加入BN层使中间层的数据输出更加稳定，提高网络的训练精度；采用全局平均池的方法取代原模型Flatten层以降低运算量。通过这三种方式有效地改进了LeNet-5网络，使其能够适用于移动机器人平台，实现对物体的识别。

本文详细内容请下载: http://www.chinaaet.com/resource/share/2000003185

作者信息：

郑睿1，2，余童1，2，程龙阅1

(1.安徽师范大学物理与电子信息学院，安徽芜湖241002；

2.安徽省智能机器人信息融合与控制工程实验室，安徽芜湖241000)

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容