[D20] 物件侦测(1)

物件侦测(Object Detection)是影像辨识中重要的一环~
物件侦测就是在照片或影片等图像内容中,用""标出物件的范围,并且分类为何种物件及附带他是此物件的猜测机率

前面有提过:卷积神经网路(CNN)开始大量的被运用来提升辨识率,可以用来辨识影像。
除了辨识影像,另一个研究方向就是物件的侦测,除了分类,还要框出物件的位置。而且除了框出物件的位置还要能即时的反应物件的移动。
 

种类

物件侦测分为两大类: two stageone stage

  • Two stage
    先用演算法生成样本的候选框,再透过卷积神经网络做影像辨识,是电脑物件侦测中的一般作法。
  • One stage
    很字面上的意思,物件的类别和位置侦测及物件辨识一步到位!这样的做法速度很快,但精确度就比 two stage 略低了一些。
    但整体辨识率仍在可接受范围内,因此 One stage 的方法是目前比较多人研发用在行动装置上的方法。

名词解释

现在先来认识一下在物件侦测中会经常看到的名词吧~

  • Selective Search
    这就是上面 two stage 中提到的演算法,透过人工的方式先把物件可能在的地方挑选出来。

  • Region Proposal
    经由演算法所挑选出的区域,我们称为 Region Proposal。

  • Bounding box
    我们在文章一开始提到的"框",就是影像辨识中的 bounding box。它含有四个参数(bx, by, bh, bw),分别代表框的 x 座标、y座标、长和宽。

  • Ground truth
    bounding box 需要又实际的基准可以比较,而那个基准就称为 Ground truth,可视为影像中真正包含目标物件的 bounding box。

  • Object classification & localization
    物件的分类定位是物件侦测中最主要的步骤,刚刚认识的 two stage 就是将这两个步骤分开来做;而 one stage 则是将两步骤一起处理。

    *未完待续......

图片来源1
图片来源2


<<:  你是谁、你的过去都不重要,成功的能力永远都从你开始。

>>:  图的储存结构 - 相邻串列 - DAY 21

非线性回归-多项式回归 (polynomial regression in r)

废话不多说,直接附上code 影片含有程序码详细解说,若有误再烦请告知,谢谢 data(iris) ...

[Day2] 什麽是语音对话介面 VUI

在进入正式的开发流程前, 先来简单快速地了解语音对话介面的一些关键词。 语音对话介面 (Voice ...

Day 28. slate × Transforms × Node

最後终於来到了我们最後一个章节:『 Transforms 』。 Transform 在 slate...

[ Day 09 ] State 是什麽?

在前面的篇幅中有提到, React.js 是采用元件式开发并可以设定每个元件不同的状态( Stat...

30天学会C语言: Day 11-什麽都可以取名字

前置处理器(Preprocessor) 在程序码最前面内容,编译前编译器会依照这些内容进行不同的处理...