[D22] 物件侦测(3)

上一篇我们认识了基本的 R-CNN 和 Fast-RCNN,接着来看 Faster RCNN!

  • Faster RCNN
    Fast R-CNN的改进,包括了减少在 R-CNN 重复提取特徵的缺点,将 ROI 映射到 feature maps 上,并用 ROI pooling 统一维度等等。
    但是为了迎来更快的侦测速度,在 Proposals 上的处理也需要更有效率。
    Faster RCNN 就是依据前两个模型为基础做改进,主要是以"RPN"和"Anchor box"的配合取代了 Selective Search!

    • RPN:接收一个 feature map 作为输入 ,输出一系列目标物体出现可能性较高的候选框。

    • Anchor box:使用 RPN 的目标是对候选框的回归,而网络不可能自动生成任意大小的候选框,这时就需要 Anchor ,Anchor 会根据feature map 在原图片上划分出很多大小、宽高比不相同的 Anchor box。

    feature map 上一个像素可以映射到原图上 16 x 16 的区域大小,然後按照 1:2 ,1:1 ,2:1 三种比例生成 Anchor box。

机器只取机率前 300 高的 anchor box 进入後面的程序,这样足以获得很好的结果,也同时节省运算时间。那要怎麽辨别 anchor box 的去留呢?

  1. 与 ground truth 有最大的 IoU。
  2. 与任一个 ground truth 的 IoU 大於 0.7。

IoU:Intersection over union,框框的交集面积除以框框的联集面积,值会介於 0~1 之间(0 表示预测位置与标准答案之间一点边都没碰到;1 表示预测位置完全吻合标准答案)
图片来源1
图片来源2
论文


<<:  [Android Studio 30天自我挑战] ListView点选後动作

>>:  Youtube Analytics API 教学 - 打破地理位置的界线 'country' 维度

Day14 参加职训(机器学习与资料分析工程师培训班),Django实作 & 深度学习

上午: AIoT资料分析应用系统框架设计与实作 今日老师教学运用Django框架,将Bootstra...

python的基本语法-1

流程控制 if...else 我自己是把它当成一种选择的概念 其实在生活中这个概念是很常见的,经常都...

站在巨人的肩膀上

笔者某次因为商务需求,到外贸协会申请调阅资料,想看历年来东南亚某国与台湾各项产业的贸易数据,惊讶的发...

[Day21]- 正则表达式

基础 用文字去表达,使用\d去表示0-9的数字字元,使用re模组内有的compile()方法,回传...

Flutter基础介绍与实作-Day28 旅游笔记的实作(9)

今天就继续来做剩下的两个地区吧! 一样先在assets资料夹内的View资料夹里建立南部和东部的资料...