[D20] 物件侦测(1)

物件侦测（Object Detection）是影像辨识中重要的一环～
物件侦测就是在照片或影片等图像内容中，用＂框＂标出物件的范围，并且分类为何种物件及附带他是此物件的猜测机率。

前面有提过：卷积神经网路（CNN）开始大量的被运用来提升辨识率，可以用来辨识影像。
除了辨识影像，另一个研究方向就是物件的侦测，除了分类，还要框出物件的位置。而且除了框出物件的位置还要能即时的反应物件的移动。
　

物件侦测分为两大类： two stage 和 one stage

Two stage
先用演算法生成样本的候选框，再透过卷积神经网络做影像辨识，是电脑物件侦测中的一般作法。
One stage
很字面上的意思，物件的类别和位置侦测及物件辨识一步到位！这样的做法速度很快，但精确度就比 two stage 略低了一些。
但整体辨识率仍在可接受范围内，因此 One stage 的方法是目前比较多人研发用在行动装置上的方法。

现在先来认识一下在物件侦测中会经常看到的名词吧～

Selective Search
这就是上面 two stage 中提到的演算法，透过人工的方式先把物件可能在的地方挑选出来。
Region Proposal
经由演算法所挑选出的区域，我们称为 Region Proposal。
Bounding box
我们在文章一开始提到的＂框＂，就是影像辨识中的　bounding box。它含有四个参数（bx, by, bh, bw），分别代表框的 x 座标、y座标、长和宽。
Ground truth
bounding box 需要又实际的基准可以比较，而那个基准就称为 Ground truth，可视为影像中真正包含目标物件的　bounding box。
Object classification & localization
物件的分类和定位是物件侦测中最主要的步骤，刚刚认识的 two stage 就是将这两个步骤分开来做；而 one stage 则是将两步骤一起处理。

*未完待续．．．．．．