《电子技术应用》
您所在的位置:首页 > 人工智能 > 设计应用 > 基于改进LeNet-5的形状类似物体识别方法
基于改进LeNet-5的形状类似物体识别方法
《信息技术与网络安全》2020年第6期
郑 睿1,2,余 童1,2,程龙阅1
1.安徽师范大学 物理与电子信息学院,安徽 芜湖241002; 2.安徽省智能机器人信息融合与控制工程实验室,安徽 芜湖241000
摘要: 针对深度学习在对外形类似物体的识别上存在着识别精度低、耗时长等问题,提出基于改进的LeNet-5的识别方法。在传统LeNet-5网络基础上,将卷积层变为双层非对称卷积使网络有更好的特征提取能力;通过批量归一化提高网络泛化能力;采用全局平均池化替代原Flatten层,用于克服传统全连接层参数多、耗时长的缺点;通过对训练集进行增广增加训练样本。实验结果表明,改进LeNet-5网络的训练精度达到91%,识别形状类似物体的精度为87%,且能在较少迭代次数内收敛,这些指标均显著优于原网络。
中图分类号: TP183
文献标识码: A
DOI: 10.19358/j.issn.2096-5133.2020.06.006
引用格式: 郑睿,余童,程龙阅. 基于改进LeNet-5的形状类似物体识别方法[J].信息技术与网络安全,2020,39(6):31-37,43.
Recognition method of similar-shaped objects based on improved LeNet-5
Zheng Rui1,2,Yu Tong1,2,Cheng Longyue1
1.College of Physics and Electronic Information,Anhui Normal University,Wuhu 241002,China; 2.Anhui Province Engineering Laboratory of Intelligent Robot′s Information Fusion and Control,Wuhu 241000,China
Abstract: Aiming at the problems of low recognition accuracy and long time-consuming in the recognition of similar shape objects by deep learning, a recognition method based on improved LeNet-5 is proposed. Based on the traditional LeNet-5 network, changing the convolutional layer into a double-layer asymmetric convolution makes the network have better feature extraction capabilities; the generalization ability of the network is improved by batch normalization; the original Flatten layer is replaced by global average pooling,which is used to overcome the shortcomings of the traditional fully-connected layer with many parameters and long time-consuming; the training sample is increased by augmenting the training set. Experimental results show that the training accuracy of the improved LeNet-5 network reaches 91%, the accuracy of identifying objects with similar shapes is 87%, and it can converge within a small number of iterations. These indicators are significantly better than the original network.
Key words : LeNet-5 network;image recognition;asymmetric convolution;batch normalization;maximum average pooling

当前,基于视觉的智能机器人已经应用于各领域中。当机器人面临需要抓取形状类似、硬度不同的物体时,智能机器人应选择不同的抓取力。因此,通过视觉识别出这类物体具有较高实用价值。利用深度学习对图像进行识别是较为高效的方法,国内外相关研究已经在车辆及车道线检测、人脸识别、手写体识别等领域取得较多的成果。

近年来,针对形状类似物体的识别也取得了一定的成果。张雪芹等人利用深度学习AlexNet网络实现了对多种类植物图片进行分类识别。林思思等提出融合深度特征和人工特征的花卉图像特征提取方法,并在此基础上实现花卉图像的分类。西南交通大学秦放提出基于深度学习的昆虫图像识别研究,扩充了昆虫样本集,基于昆虫图像识别的任务需求和样本集,从网络和训练两个方面进行改进。张立超等人利用LeNet-5网络对两种品种的苹果进行分类识别,在两种苹果的分类中取得不错的效果。但大型的神经网络一般通过加深网络深度获得高精度的识别率,其结构较为复杂,运算量大,无法满足快速识别的要求。

因此,本文选择LeNet-5网络作为研究对象,由于LeNet-5网络结构较为简单,运算量较小,对硬件配置要求低,能够在满足网络轻量化的前提下对形状类似、硬度不同的物体实现快速识别。传统LeNet-5网络在识别精度上尚有不足。为了能够提高识别精度且尽可能地减少运算量,本文将传统卷积核拆分为非对称卷积核以缩短计算时间;在网络中间加入BN层使中间层的数据输出更加稳定,提高网络的训练精度;采用全局平均池的方法取代原模型Flatten层以降低运算量。通过这三种方式有效地改进了LeNet-5网络,使其能够适用于移动机器人平台,实现对物体的识别。



本文详细内容请下载:  http://www.chinaaet.com/resource/share/2000003185

作者信息:

郑  睿1,2,余  童1,2,程龙阅1

(1.安徽师范大学 物理与电子信息学院,安徽 芜湖241002;

2.安徽省智能机器人信息融合与控制工程实验室,安徽 芜湖241000)


此内容为AET网站原创,未经授权禁止转载。