我开始看到以为是要实现的是 detection,提取 bounding box 那种。有点想试试用 HOG+SVM或者LDA做一个sliding window detector 作为baseline看看效果。用 deep learning 实现detection的方法有
XXXXXXXXXXXXXXXXX/abs/1506.01497,
XXXXXXXXXXXXXXXXX/abs/1506.02640 。最后纯从工程的角度讲,感觉要实现探测空中的无人机这个目标,从相对静止的画面中探测移动物体,比从静止画面中探测静止物体要来得容易,可参考各种成熟的行人探测算法。考虑到 training set是 synthetic 的,建议 testing set 使用自然图片,来评估训练模型对自然图片的generalization效果。
另外刚想到一个收集无人机 bounding box 视频数据的方法:在无人机机身布置不会对外观造成明显影响的红外信标,拍摄时同时使用普通相机和加有滤光片的红外相机。考虑到无人机外形大概就那么几种,分别制作一系列便可。