《电子技术应用》
您所在的位置:首页 > 模拟设计 > 设计应用 > 基于优化多视角图像采集的点云分类
基于优化多视角图像采集的点云分类
2021年电子技术应用第10期
何瑞函1,2,蔡 勇1,2,张建生1,2
1.西南科技大学 制造科学与工程学院,四川 绵阳621010; 2.制造过程测试技术省部共建教育部重点实验室,四川 绵阳621010
摘要: 基于二维多视角3D识别方法中,可使用多个2D投影图表示三维模型特征信息,但不同视角投影图像的特征不同,神经网络对其学习效率也有所差异。卷积神经网络能够映射图像的特征,可用此方法分析这个问题。混合视角数据集分析不同视角投影特征在卷积神经网络中的重要性,根据重要性的不同优化混合视角数据集的采集密度。最终实验结果表明,不同视角产生的二维图像分类准确率不一样,其中俯视角度投影的分类准确率最差,优化后的数据集在相同神经网络模型下达到了最优分类准确率。
中图分类号: TP391.7
文献标识码: A
DOI:10.16157/j.issn.0258-7998.200892
中文引用格式: 何瑞函,蔡勇,张建生. 基于优化多视角图像采集的点云分类[J].电子技术应用,2021,47(10):82-85.
英文引用格式: He Ruihan,Cai Yong,Zhang Jiansheng. Point cloud classification based on optimized multi-view image acquisition[J]. Application of Electronic Technique,2021,47(10):82-85.
Point cloud classification based on optimized multi-view image acquisition
He Ruihan1,2,Cai Yong1,2,Zhang Jiansheng1,2
1.School of Manufacturing Science and Engineering,Southwest University of Science and Technology,Mianyang 621010,China; 2.Key Laboratory of Testing Technology for Manufacturing Process,Mianyang 621010,China
Abstract: In the 3D recognition method based on 2D multi-perspective, multiple 2D projected images can be used to represent the feature information of 3D model. However, the features of projected images from different perspectives are different, and the learning efficiency of the neural network is also different. The convolutional neural network can map the features of images, and this method can be used to analyze this problem. The importance of projection features of different perspectives in the convolutional neural network was analyzed in the mix-view data set, and the collection density of the mix-view data set was optimized according to the different importance. The final experimental results show that the classification accuracy of 2D images generated from different perspectives is different, among which the classification accuracy of overhead projection is the worst, and the optimized data set achieves the optimal classification accuracy in the same neural networks model.
Key words : 3D point cloud;multi-view image;convolution neural network;image classification

0 引言

    随着激光扫描技术的发展,点云作为最能表现物体三维特征的数据深受研究者热爱。深度学习、卷积神经网络(Convolutional Neural Network,CNN)[1-2]近几年引领计算机视觉领域的研究趋势,并且CNN网络在二维图像分类与识别上显得高效。点云在空间中的无序性、旋转不变性、非结构化数据,导致其不能直接作为CNN网络的输入[3]。因此,使用深度学习对点云进行研究的方法有3种:多视图[4]、体素法[5]、直接对点云[6-7]

    基于二维多视角3D识别的方法,本文通过优化采集数据集的方式提升CNN神经网络[8]的分类效果。本文对点云模型进行不同视角投影,得到多组2D图像数据集。首先用多个VGG16卷积模型[9-10]提取单独视角数据集,得到多个映射了图像特征的卷积神经网络模型;然后将多个包含特征的VGG16模块加上自定义层后“并联”连接分类层作为分析网络模型,混合视角图像数据集作为网络输入;最后通过分析多个特征提取模块的权重,优化多视角图像的采集密度,提升二维多视角3D识别效率,即分类效果。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003788




作者信息:

何瑞函1,2,蔡  勇1,2,张建生1,2

(1.西南科技大学 制造科学与工程学院,四川 绵阳621010;

2.制造过程测试技术省部共建教育部重点实验室,四川 绵阳621010)




wd.jpg

此内容为AET网站原创,未经授权禁止转载。