上一篇我们认识了基本的 R-CNN 和 Fast-RCNN,接着来看 Faster RCNN!
Faster RCNN
Fast R-CNN的改进,包括了减少在 R-CNN 重复提取特徵的缺点,将 ROI 映射到 feature maps 上,并用 ROI pooling 统一维度等等。
但是为了迎来更快的侦测速度,在 Proposals 上的处理也需要更有效率。
Faster RCNN 就是依据前两个模型为基础做改进,主要是以"RPN"和"Anchor box"的配合取代了 Selective Search!
RPN:接收一个 feature map 作为输入 ,输出一系列目标物体出现可能性较高的候选框。
Anchor box:使用 RPN 的目标是对候选框的回归,而网络不可能自动生成任意大小的候选框,这时就需要 Anchor ,Anchor 会根据feature map 在原图片上划分出很多大小、宽高比不相同的 Anchor box。
feature map 上一个像素可以映射到原图上 16 x 16 的区域大小,然後按照 1:2 ,1:1 ,2:1 三种比例生成 Anchor box。
机器只取机率前 300 高的 anchor box 进入後面的程序,这样足以获得很好的结果,也同时节省运算时间。那要怎麽辨别 anchor box 的去留呢?
IoU:Intersection over union,框框的交集面积除以框框的联集面积,值会介於 0~1 之间(0 表示预测位置与标准答案之间一点边都没碰到;1 表示预测位置完全吻合标准答案)
图片来源1
图片来源2
论文
<<: [Android Studio 30天自我挑战] ListView点选後动作
>>: Youtube Analytics API 教学 - 打破地理位置的界线 'country' 维度
上午: AIoT资料分析应用系统框架设计与实作 今日老师教学运用Django框架,将Bootstra...
流程控制 if...else 我自己是把它当成一种选择的概念 其实在生活中这个概念是很常见的,经常都...
笔者某次因为商务需求,到外贸协会申请调阅资料,想看历年来东南亚某国与台湾各项产业的贸易数据,惊讶的发...
基础 用文字去表达,使用\d去表示0-9的数字字元,使用re模组内有的compile()方法,回传...
今天就继续来做剩下的两个地区吧! 一样先在assets资料夹内的View资料夹里建立南部和东部的资料...