更新時(shí)間:2023年03月06日11時(shí)35分 來(lái)源:傳智教育 瀏覽次數(shù):
SSD算法的全名是Single Shot MultiBox Detector,Single shot指明了SSD算法屬于one-stage方法,MultiBox指明了SSD是多框預(yù)測(cè)。對(duì)于Faster R-CNN,先通過(guò)CNN得到候選框,然后進(jìn)行分類和回歸,而YOLO和SSD可以一步完成檢測(cè),SSD的特點(diǎn)是:
SSD提取了不同尺度的特征圖來(lái)做檢測(cè),大尺度特征圖可以用來(lái)檢測(cè)小物體,而小特征圖用來(lái)檢測(cè)大物體;
SSD采用了不同尺度和長(zhǎng)寬比的先驗(yàn)框,在faster r-cnn和yoloV2,V3中稱為Anchors。
SSD是YOLO V1出來(lái)后,YOLO V2出來(lái)前的一款One-stage目標(biāo)檢測(cè)器。SSD用到了多尺度的特征圖,在之后的YOLO V3的darknet53中,也是用到了多尺度特征圖的思想。較淺層的特征圖上,每個(gè)cell的感受野不是很大,所以適合檢測(cè)較小的物體,而在較深的特征圖上,每個(gè)cell的感受野就比較大了,適合檢測(cè)較大的物體。
SSD采用VGG16作為基礎(chǔ)模型,然后在VGG16的基礎(chǔ)上新增了卷積層來(lái)獲得更多的特征圖以用于檢測(cè)。如下圖所示:
整個(gè)特征圖分為三部分:
backbone: VGGnet用于圖片特征提取的網(wǎng)絡(luò)。
Extra: 用于引出多尺度特征圖的網(wǎng)絡(luò)。
Loc和cls: 用于框位置回歸和目標(biāo)分類的網(wǎng)絡(luò)。
北京校區(qū)