文 献 综 述
前言:
本毕业设计以三维目标检测为主要研究目标,尝试设计出一个从点云数据中检测三维目标的算法。激光雷达作为民用及军事上常用的主动遥感设备,其具有传统雷达所不具备的诸多工业及军事优势,近期工业界比较看好的自动驾驶项目就搭载此类雷达进行路况扫描。激光雷达的测量原理主要是:当一束激光照射到物体表面时,所反射的激光会携带方位、距离等信息。若将激光束按照某种轨迹进行扫描,便会边扫描边记录到反射的激光点信息,由于扫描极为精细,则能够得到大量的激光点,因而就可形成激光点云。这些得到的大量点云数据需要进行一系列处理和分析,才能获得激光束所扫描、反馈的物体信息。本毕业设计旨在设计一个算法,以实现自动从雷达点云数据中检测三维物体的目标,同时也为学术界提供一种新的检测三维目标的思路,具有一定的工业价值和学术意义。为了解该研究方向的主要研究内容及该领域的最新成果,本设计参考了IEEE近几年有关三维目标检测和雷达电云处理的会刊,包括CVPR 2017—2019、IROS 2018等,以及arxiv预印本网站上有关此研究方向的部分论文,为该设计提供一些知识储备。
正文:
根据传统算法所提供的思路,实现基于雷达点云的三维目标检测主要在点云数据上通过以下三种方法来实现:3D卷积、投影到图像前平面、在鸟瞰图上操作。由于近几年神经网络较为盛行,业界主要通过在点云数据生成的鸟瞰图(或俯视图)上进行3D卷积提取点云特征,再从特征层(中间层)上进行3D边界框回归来预测目标空间的大小、方向,或是使用区域建议网络(RPN)为多个目标类别生成可靠的3D目标候选区域。一般来说,目前主流的点云检测网络可分为三类:多视图、体素图、点图。这三类分别通过融合多元信息、用体素代替局部点云数据以及处理所有点云数据的方法,取得了不同的效果。
我所参考的文献大致可以分为四类:
一类是基于多视图的3D目标检测,使用多视图加上融合网络提升目标检测精度,主要有MV3D和AVOD两种方法。比如Multi-View 3D Object Detection Network for Autonomous Driving,这篇文章提出将雷达点云与单目视觉融合,在3D卷积提取点云特征并进行3D边界框回归后,将生成的3D提案投影到俯视图,鸟瞰图和单目图像,通过一个融合网络,用多任务损失函数进行训练。这篇文章较出色地通过该融合网络提取点云数据的深度信息,提升训练模型的精度。它的主要贡献是,将3D提案投影到俯视图,鸟瞰图和单目图像,提供了3D检测与单目图像(双目图像)融合的主要结构,改进了MV3D的融合网络,提高了目标检测的精确度。
一类,采用基于体素图的方法,对点云数据表示的3维空间数据进行简化。这个方向的常见框架是voxelnet,其只使用点云数据进行3D检测。如VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection这篇文章。它直接处理点云数据,采用VFE网络对所有体素内的点进行编码并加上3D区域建议网络(RPN)检测,不使用手工特征处理。作者提供了体素划分的方法:先是体素分区,将输入点云所在空间划分为多个整数化的网格,随后根据点所在的voxel进行分组,每个分组保留t个数据,点云数据多于t个数据的分组则随机采样t个数据以降低计算复杂性和采样偏差。作者最大的贡献在于,其提供了VFE层级结构,契合点云数据的稀疏特征结构。这一层级结构在减少点云数据量的基础上,较好地保留了点云数据的局部特征和点的特征。同时,不同voxel结合,还可以得到类似于point-wise的voxel-wise特征,即基于全voxel的相关性特征。在VFE特征提取结构中,结构通过作用每一个非空体素,使得每一个非空体素能用一个稀疏张量表示,每一个稀疏张量都唯一关联于一个体素,大大降低了反向传播时的内存成本和计算成本。
一类,采用基于2D图像的方法,将成熟的2D目标检测运用到3D目标检测上。如Frustum PointNets for 3D Object Detection from RGB-D Data这篇文章,它通过对2D图像检测并提取目标,生成3维的锥形建议区域。随后在3维的锥形建议区域上进行3D实例分割和3D模态目标估计,估计3维锥形建议区域的目标大小、方向与类别,这一过程与传统算法相似,主要采用3D边界框回归和卷积神经网络来对目标进行预测。
一类是点图,基于点图的常见框架有pointnet、Pointpillars、point-rcnn等。PointPillars: Fast Encoders for Object Detection from Point Clouds这篇文章提供了简化点云图的一种方法:使用pointpillars(点柱),即学习点云垂直列上的特性,从而为对象预测面向3D的框。其优点是只需使用二维卷积就能预测三维目标,实现端到端的点云学习。作者设计了三个结构以将三维数据转换为二维数据进行卷积:将点云转换为稀疏伪图像的特征编码器网络、将伪图像处理为高级表示的2D卷积主干网络、探测和回归3D box的探测头。以将点云转换为稀疏伪图像为例,作者在俯视图上对点云数据进行网格划分,方式与体素化类似,但每个网格中点柱中的点的维度扩展为9维,增加点与网格中心和点柱中心的偏差。再用一个简化的PointNet从各点9维中学习特征再展开,形成一个伪图像形式。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。