知识点总结
- 首先利用Selective Search方法提取Region Proposal
- Region Proposal缩放后送入到CNN网络,为什么要缩放,因为fc层要求固定大小的输入。
- CNN提取特征后,送入到后面的SVM进行分类(这里还涉及到难例挖掘)
- 回归部分,利用4个线性回归,对proposal的坐标计算。
- CNN使用预训练模型,然后在VOC上进行finetune
一个比较大的创新
DPN是在resneXt,denseNet之后,对resnet系列的进一步创新,作者巧妙的将resnet与denseNet相结合,提出了dual path architectures,构造了DPN网络结构。
创新点:DenseNet作为2017CVPR最佳论文,其在ResNet基础上,提出了更优秀的shortcut方式,Dense Connection 不仅能使得feature更加强健,还能带来更快的收敛速度。并且DenseNet具有比ResNet更少的参数,在测试时具有更快的速度
创新点:ResNeXt在ResNet的基础上,结合ResNet的block stack策略以及Inception结构分组卷积的思想,设计aggregrated transformations策略,在不增加模型复杂度的情况下,提高了模型识别的准确率,虽然没有提出特别新奇的网络结构,但是ResNeXt利用更简单的拓扑结构在不增加参数的情况下取得更好的效果,值得借鉴与思考。**其实resnext仅仅就是利用了group convolution,降低了网络的参数量,但是同时,增加了channel,发挥channel的效果,使得resnext的效果得到了一定的提升.
边缘检测总结
Sift等的介绍
目前,CNN网络在图像识别领域大放异彩,从最初的AlexNet到后面的GoogLeNet,ResNet,识别精度越来越高,但是除了精度之外,模型的计算复杂度也越来越引起大家的思考,如何降低网络的复杂度,以使网络可以高效的运行在诸如手机登移动端设备,也得到了众多研究者的研究。本文便主要在这方面发力,提出了提高网络速度设计的4个准则,并基于此设计了shuffleNet v2,在速度、精度均超过了目前的主流轻量级网络(shuffleNet v1, mobileNet v2等),本文是Face++提出,发表于ECCV2018.