引用 Cirno:
我非常奇怪一点是,为什么你表示从 conv1 的输出能看出 object level 的效果。conv1 只是提取low level的 edge response,如果在存在有复杂背景的情况下,仍然能……
conv1(7x7)中有很多网格状的weight,我认为它们对应的是训练样本中大量的建筑物背景。当背景为建筑物,且前景无人机尺寸较小的时候,无人机的外形会和建筑物表面的纹理混在一起(这类样本挺多的,说实话肉眼都不太好识别),要将它们有效地区分开来,cnn就必须能够检测到建筑物表面纹理的不连续,以从中分辨出无人机。
另外0.9仅仅是过拟合了一点点,validation set的命中率达到0.85了。现在的问题不是网络规模太大,而是太小了,然后训练数据是足够的,但是训练目标(binary classifier)和我希望做的最终任务不符(我修改了上面的帖子,增加了另一篇黑R-CNN以及类似detection方法的文章)。我会根据最近的阅读成果,重做dataset,并调整训练目标。
另外:我提供的两张detection示范图片,每个框的绘制方法,是当前像素值+20,所以如果两个框的边缘重叠,那条边会显得亮一点。两张图中无人机所在的位置,都处在多个框重叠的中心,从结果上应该说是成功的。
或者我改成实心填充,这样就更方便看了:
this should work for a drone jammer...