《电子技术应用》
您所在的位置:首页 > 人工智能 > 设计应用 > 基于双流卷积神经网络和生成式对抗网络的行人重识别算法
基于双流卷积神经网络和生成式对抗网络的行人重识别算法
《信息技术与网络安全》2020年第6期
林 通,陈 新,唐 晓,贺 玲,李 浩
中国人民解放军空军预警学院,湖北 武汉430019
摘要: 近年来,针对行人重识别问题的深度学习技术研究取得了很大的进展。然而,在解决实际数据的特征样本不平衡问题时,效果仍然不理想。为了解决这一问题,设计了一个更有效的模型,该模型很好地解决了目标的不同姿态的干扰以及数据集中的图片数量不足的问题。首先,通过迁移姿态生成对抗网络生成行人不同姿势的图片,解决姿态干扰及图片数量不足的问题。然后利用两种不同的独立卷积神经网络提取图像特征,并将其结合得到综合特征。最后,利用提取的特征完成行人重识别。采用姿势转换方法对数据集进行扩展,有效地克服了由目标不同姿势引起的识别误差,识别错误率降低了6%。实验结果表明,该模型在Market-1501和DukeMTMC-Reid上达到了更好的识别准确度。在DukeMTMC-Reid数据集上测试时,Rank-1准确度增加到92.10%,mAP 达到84.60%。
中图分类号: TP18
文献标识码: A
DOI: 10.19358/j.issn.2096-5133.2020.06.002
引用格式: 林通,陈新,唐晓,等. 基于双流卷积神经网络和生成式对抗网络的行人重识别算法[J].信息技术与网络安全,2020,39(6):7-12.
Dual stream ConvNet-Gan for person re-identification
Lin Tong,Chen Xin,Tang Xiao,He Ling,Li Hao
People′s Liberation Army Force Army Early Warning Academy,Wuhan 430019,China
Abstract: The performance of current algorithm of person re-identification(ReID) has been made great progress, but there are still a lot of difficults in dealing with different backgrounds and poses. In order to cope with the difficult in actual scenes, this paper proposes a novel model, which can very well solve the problem that the characters have different poses and the number of pictures in the dataset is insufficient and uneven. Firstly the IDs with a relatively small number of images are screened out to expand by transferring pose and solve the problem of imbalanced datasets. Then two different convolutional neural networks are used to extract picture features and they are joined to get different characteristics. In the end, the task with extracted features is completed. This model solves the impact of different poses on the recognition effect very well. At the same time, it uses two independent feature extraction networks to extract the features of the person more comprehensively. Experimental results confirm that this model significantly improves performance and achieves high accuracy in Market-1501 and DukeMTMC-Reid. When tested on the DukeMTMC-Reid dataset, Rank-1 was increased to 92.10%, and mAP was increased to 84.60%.
Key words : person ReID;CNN;generative adversarial network;pose transfer

行人重识别(ReID)的目的是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。由于其在安全和监控方面的重要应用,受到了学术界和工业界的广泛关注。这一任务极具挑战性,因为不同相机拍摄的图像往往包含由背景、视角、人体姿势等变化引起的显著变化。

在过去的几十年中,大多数现有的研究都集中在度量学习和特征学习上,设计尽可能抵消类内变化的算法已经成为了行人重识别的主要目标之一。起初,行人重识别的研究主要是基于全局特征,即基于全局图像获得特征向量。为获得更好的效果,开始引入局部特征,常用的局部特征提取方法包括图像分割、骨架关键点定位和姿态校正。行人重识别任务还面临一个非常大的问题,即很难获得数据。到目前为止,最大的数据集只有几千个目标和上万张图片。随着生成性对抗网络(GAN)技术的发展,越来越多的学者试图利用这种方法来扩展数据集。然而,大多数现有的针对行人重识别的算法需要大量标记数据,这限制了它在实际应用场景中的鲁棒性和可用性,因为手动标记一个大型数据集是昂贵和困难的。最近的一些文献在使用无监督学习来解决此问题,改进人工标注的特征。由于不同数据集之间的图像有明显差异,在提取图片特征问题上效果仍不理想。本文方法的贡献主要有两个方面。一方面,采用均衡采样策略和姿势迁移方法对数据集进行扩充有效地缓解了行人姿势各异造成的干扰。另一方面,利用两种不同的网络结构从图像的不同方面提取特征,使模型能学习到更为丰富全面的信息。实验结果表明,该方法具有较高的精度。例如,在Market-1501数据集上,这一模型Rank-1准确度达到了96.0%,mAP达到了90.1%,与现有算法相比,性能有较大提升。



本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003145


作者信息:

林  通,陈  新,唐  晓,贺  玲,李  浩

(中国人民解放军空军预警学院,湖北 武汉430019)


此内容为AET网站原创,未经授权禁止转载。