RFBnet论文笔记
主要说目前性能较好的目标检测主要是基于深度网络(如Resnet、Inception),其缺点是计算量大,速度慢。而一些轻量级网络速度更快,但检测准确率相对较低。作者提出了RFB模块,并将其添加到固态硬盘的顶层来构建射频以太网。
为了构建一个快速而强大的检测器,一个合理的替代方案是通过引入一些手工制作的机制来增强轻量级网络的特征表示,而不是盲目地深化模型。
RFBnet结构描述
及格
RFB实际上是一个多分支卷积块,其内部结构由两部分组成:
1.前一部分与inception一致,负责模拟多维pRF。
2.后半部分再现了人类视觉中pRF与偏心的关系。
下图显示了RFB及其对应的空间池区域图。
具体来说,首先我们在每个分支采用一个瓶颈结构,由1×1个转换层组成,以减少特征映射中的通道数,增加n×n个转换层。其次,我们将5×5转换层替换为两个堆叠的3×3转换层,以减少参数和更深的非线性层。同理,我们用1×n加n×1转换层代替原来的n×n转换层。最后,我们应用ResNet和Inception-ResNet V2的快捷设计。
也称为astrous卷积层,该结构的基本意图是在保持相同数量的参数的同时,生成更高分辨率的特征地图,并在更大的区域内捕获更多上下文的信息。
下图显示了多分支卷积层和扩展合并或卷积层的两种组合。
所提出的RFB网络检测器重用SSD的多尺度和单级框架,其中嵌入了RFB模块以改进从轻量级主干提取的特征,使得检测器更准确并且仍然足够快。由于RFB的特性可以很容易地集成到CNN中,我们可以尽可能地保留SSD架构。主要修改是用RFB替换顶部卷积层。
使用与固态硬盘完全相同的主干网络。简而言之,它是在ILSVRC CLS-LOC数据集上预训练的VGG16,其中fc6和fc7层被转换为带有子采样参数的卷积层,其pool5层由2×2-s2变为3×3-s1。空穴卷积层用于填充空位和所有漏失层,fc8层被去除。
保持了相同的SSD级联结构,但是具有相对较大分辨率特征映射的卷积层被RFB模块取代。在RFB的主要版本中,我们使用单一的结构设置来模拟偏心率的影响。利用视觉图像之间的pRF大小和偏心率的差异,我们相应地调整RFB的参数,以形成RFB-s模块,该模块模拟浅层人类视网膜图中较小的pRF,并将其置于conv4 3特征之后。例如,因为其特征映射的分辨率太小而不能应用具有大内核(例如5×5)的过滤器,所以保留最后的卷积层。
Train主要遵循SSD,包括数据增强,硬负挖掘,默认框比和长宽比,损失函数(比如定位用的smooth L1损失,分类用的softmax损失)。与此同时,我们稍微改变了我们的学习进度,以更好地适应RFB。更多的细节在下面的实验部分给出。使用MSRA方法初始化所有新的conv图层。
下面主要是描述研究成果。相对于其他网络,不做过多描述,关于RFBnet的更多细节将在后面补充。