【简历论文备注】卷积姿态机(CPM理解)

本文主要介绍CMU开源项目OpenPose的前身CPM。这个笔记主要是给初学者快速入门,自己复习。

论文链接:零件之间的复杂和长程相关性

意思是尽可能多的了解关节点的内在依赖性。作者选择通过增加卷积核来增加感受野,以控制参数的整体数量(其他方式包括,使用汇集运算但牺牲精度;或者增加卷积层数,但是增加参数的数量)。作者还在文中贴了一张实验结果图,证明增加感受野可以提高最终精度。

并且这种关系还表明,事实上,在网络内学习的关键点之间确实存在关联(这种准确度随感受野大小的提高表明网络确实索引编码了部分之间的长程相互作用,并且这样做是有益的。).

至此,整个网络架构磕磕绊绊,一目了然~其实理解起来很简单,就是将卷积网络嵌套到Pose Machines框架中。

在训练深度神经网络时,我们经常会面临梯度消失的问题,而CPM的架构设计可以很好地解决这个问题。在每个阶段,PM会被反复训练,预测每个关键点的置信度图。以理想信念图为标签,在每个真实关键点附近构造一个高斯分布,记为,然后我们的损失函数是最小化。

总损失函数是将每一级的损失函数相加,

这里还有一张用来显示渐变的原纸示意图。

其他具体的训练过程结果这里就不展示了,比较简单。可以自己看原论文。

-第三个蘑菇-结论。

至此,整篇论文的核心思想已经明确。本文针对人体关键点检测,提出了在PM框架中嵌入卷积神经网络的CPM网络架构,并通过实验证明了其可行性,为后续开发奠定了基础。

本文的简要总结就是先列出本文的摘要,然后详细介绍作者的思路,也简单表达一下我对CPM网络架构的理解。希望你看完这篇文章后能进一步加深对这篇论文的理解。有错请指出,多交流,共同进步~?