pdf code

Sparse and noisy LiDAR completion with RGB guidance and uncertainty

这篇论文提出了一个不算复杂的方式,在20ms钟内完成对分辨率的图像与稀疏点云进行图像补全。

总体框架

image

做法总体比较直观,首先RGB图像与稀疏的投影后的lidar深度图进行concat,输入到以ERFNet为主干的encoder-decoder网络中,(需要注意的是根据ERFNet的github网页显示,其模型需要私聊才可获得),输出三个部分,一个是lidar map的局部残差,一个是全局深度预测,一个是全局深度的置信度。

而稀疏的投影后的Lidar深度图补上残差后同时输入到局部分支中,使用数个残差连接的StackedHourGlass模块,再卷积输出两个分支,一个是局部深度预测,一个是局部深度的置信度。

全局分支与局部分支,将两分支的置信度连接并使用使用softmax层形成分别的权重,再将两者的深度预测值加权求和得到。

本文具体使用的StackedHourGlass模块如图

image

训练细节

训练顺序上,作者使用pretrained ERFNet先单独对两个分支进行训练,然后再加入guidance部分以及加权部分进行端到端训练.

损失函数方面作者提出了一个新的所谓focal-MSE Loss。数学表达为:

最终损失为 其中三个参数分别为0.1, 0.1, 1