you only look once - YOLO (1)

最後的这几篇文章想要来介绍一下yolo,主要是用deep learning来做物件侦测(object detection)。
https://ithelp.ithome.com.tw/upload/images/20211012/20142004tgDnrdP0tL.png

YOLO其中一个特点是他是one stage method(region-free),全称是“you only look once”,也就是一次处理物件的位置与类别分辨;另一种方式为two stage method(region-free),方法是先侦测照片中的物体位置,裁剪之後再放入分类器判断是什麽物体。

YOLO的主要原理是切割照片成S*S的窗格(grid),每个grid都会侦测出B个框框(bounding boxs)来定义物体的位置,bounding boxs的资讯包含:(x,y)中心座标,w 宽度,h 高度, conference 物体在框框里的把握度,公式如下图:
https://ithelp.ithome.com.tw/upload/images/20211012/20142004sshFVb4HBl.png

所谓的Pr(object)是窗格内是否有物体的机率,如果有就是1,没有则是0,IOU则是intersection over union,也就是计算bounding boxs和物体实际位置的交集/联集比。

另外每个窗格(grid)也会预测物体类别,用one-hot encoding来表示,明天再来细讲相关的损失函数还有架构。

https://ithelp.ithome.com.tw/upload/images/20211012/20142004gHDFg1s0pA.png

[reference]
https://www.youtube.com/watch?v=sq_OfIhb5Oc


<<:  [Day 28] Reactive Programming - RSocket Part2

>>:  ETA screen testing (1)

30天程序语言研究

今天是30天程序语言研究的第十二天,研究的语言一样是python,今天主要学习的是物件函式和继承 网...

IOS、Python自学心得30天 Day-21 CoreML范例

前言: 关於前面mlmodel的部分还没搞定 事先测试了一下CoreML的功能 VC程序码: imp...

[Day 11] SRE - 事後检讨,拜托拜托让我吸个经验值

从历史中学习 我们最讨厌事件历史重演QQ 在每次遇到问题後,我们全员都会一起开个检讨会议,当中会提到...

结束语&心得

30天一眨眼就结束了呢!每天坚持写一篇文章,下班回家後一边写一边又翻书查找资料,没想到都撑过来了! ...

Day 08:原则、设计模式、架构

前言 接下来要介绍的东西并不是学什麽工具, 而是怎麽把我们已经会的程序语言写得更有系统, 来达到高效...