目标检测系列掩模r-CNN-预处理
在将图像输入神经网络之前,需要进行一些必要的预处理工作。
减去平均值:平均向量(3 X 1,是每个颜色通道的平均值)是所有训练图像上像素值的平均值,在测试阶段也从输入图像中减去该图像。
重新缩放:这里将考虑两个参数,即目标大小和最大大小。将图片的短边(宽度或高度)调整到目标尺寸,然后调整长边(宽度或高度)以保持纵横比不变。但是如果调整后的长边(宽度或高度)超过了最大尺寸,就需要将边的尺寸调整到最大尺寸,短边(宽度或高度)按照原来的长宽比调整,保持长宽比不变。目标大小和最大大小的默认值分别为800和1333。
边缘填充:因为使用了FPN,所以边缘填充是必要的。所有的填充都只在最右边和最下边,所以目标坐标不会受到影响,坐标系从左上角开始。如果不使用FPN,则不需要执行此步骤。
图片的宽度是最小的边(600)。在将其重新调整为800后,另一个高尺寸根据宽高比调整大小,以获得新的高度(1200),但1200不是32的倍数,因此需要填充它,以便结果尺寸是32的倍数(1216/32
注意:锚点生成和卷积步骤中使用的图像的高度和宽度将被视为调整后的图像,而不是填充的高度。