多分支层次分割的纸质阅读对象提议

本文来自上海交通大学BCMI和CVPR 2015。这是一个带有分段的建议。本文在选择性搜索原型的基础上，进一步探讨了区域聚合方法。

基于分段的目标提议方法的主要思想是组合分割的图像区域以获得目标区域。有一个问题:上一步的错误会导致下一步的错误，这种单向合并分割区域的方法是有缺陷的。因此，本文采用多分支的方法来扩大搜索范围，提高准确率。

简单地使用贪婪策略通过搜索划分的区域空间来得到目标区域是不可取的。本文对分割区域的合并采用了一个原则:包含多个颜色和纹理区域的复杂目标需要使用不同的合并策略来完成分割区域的合并。本文的主要思想是结合多种组合策略来提高选择性搜索方法的准确性。

本文的研究内容主要由两部分组成:多分割区域组合策略和分割区域搜索。

(1)学习互补合并策略

本文将区域合并的过程抽象为一个线性分类器，通过改变每个训练样本的权重来训练分类器(类似于Boosting过程)。但与Boosting不同，本文提出的区域组合分类器不是将多个弱分类器组合成一个强分类器，而是通过分类器之间的误差修正形成一个新的分类器。

(2)多阶段分支

通过上述区域组合分类器，可以搜索图像分割区域，将一个贪婪聚集步骤分成多个步骤。

本文通过树形组织增加分割区域的组合搜索空间，并利用区域组合的结果训练SVM分类器。

本文用树形分支来组织不同的区域组合策略，同一分支下区域组合策略的划分方法相同。

假设区域聚合树的高度为t，树的每个非叶节点的度为k，在底层可以得到KT个区域聚合结果，总共* * *，可以得到一个提议窗口，其中λ表示每个区域聚合中增加的分散区域的数量，n表示初始图像拥有的分割区域的数量。您可以使用λ和n来控制建议的最终数量。

每个分支的生成过程实际上是一个贪婪聚合的方法，只是这个过程是分层的。

前面一点描述了如何分支，然后如何使用图像分割区域聚合树生成建议，主要是如何设计分割区域分类器。

为了使建议的分类模型在图像分割区域聚合树的不同分支上相同，使用二元线性分类器(binary linear classifier)对分割区域进行分类。

即把属于同一对象的不同区域作为正例，把属于不同对象的不同区域作为反例作为训练。然后得到相应的SVM分类器。

实验的原始图像数据来自PASCAL VOC2007。初始图像分割算法和图像区域特征与选择性搜索完全相同。本文主要对区域聚合算法进行了改进。

用于比较的算法是选择性搜索(SS)、地理对象建议(GOP)、全局和局部搜索(GLS)、边缘框(EB)和二值化归一化梯度(Bing)。

实验结果对比如下:

相比之下，我们的方法和选择性搜索(SS)没有太大区别。当建议数较低时，边缘盒和选择性搜索的结果优于本文提出的方法。在建议数较多的情况下，本文提出的方法效果稍好。

上表是PASCAL VOC2007中几种方法加R-CNN的识别结果对比，对比案例中的IoU参数在文章中没有注明。从表中可以看出，本文提出的算法在检索精度上与选择性搜索没有太大区别，本文提出的算法的改进非常有限。

本文的主要思想是对分割区域聚合过程中的选择性搜索方法进行改进。本文利用多层树聚集方法将以前的单个贪婪聚集过程分成多个贪婪聚集过程，并利用SVM对区域进行分类。本文采用的树形区域聚合方法确实增加了分割区域聚合的搜索空间，但从单个进程的角度来看仍然是贪婪聚合，所以文章对选择性搜索的改进不大，主要提供了一种分割区域聚合的新思路。

与实验结果相比，本文提出的方法仅在建议数较少的情况下略优于选择性搜索，但其空间复杂度远大于选择性搜索，且增加了计算建议的时间。

物体识别的选择性搜索。国际计算机视觉杂志104.2(2013):154-171。