Day4 - Yolo? 那是什麽? 能玩吗?

今天要介绍的是(小鼓滚奏)……………..YOLO!
YOLO(you only live once)原为网路用语,意旨活在当下,享受人生。
但今天的YOLO(you only look once)是一个物件侦测的类神经网路演算法,以darknet架构实作,作者为 Joseph Redmon。其中又以轻量.高效率为特点。

接下来介绍YOLO各版本的进展、优缺点以及更新内容—

  1. YOLO v1:
    Yolo直接用整张图片当作神经网路的输入,比起R-CNN耗时费力的逐一pixel形成大量window;yolo则是刚开始就把图片切割成SxS等分,并且只需要让物体中心在框(Bounding Box)内即可,这样就不需要让整个物体都在框中。到最後输出会有长(L)、宽(H)、中心(x,y)、信心程度(confidence)。
    https://ithelp.ithome.com.tw/upload/images/20210904/20140460q0y1NBRB0N.png
    ▲最後输出会长这样
    至於第一代的优缺,优点是速度快,可以达到实时(Real Time)的效果,但是位置的精准度还有待加强,而且小型的东西预测准度会较差。
    https://ithelp.ithome.com.tw/upload/images/20210904/201404600O5Lthqpgu.png

  2. YOLO v2:

  • 最大的变化是改进V1精度不足的缺点,使用了anchor box。
  • 以卷积层(conv layer)取代掉原本的全连接层(fc layer)。
  • 提高解析度 : 因为V1训练时第一步是先用224224训练,第二步再丢给448448训练。这样会导致V1的conv layer需要适应新的resolution。V2则更改成在第一步时就先让他看一点点的448*448,这样在第二步训练时就不会水土不服。
  • 加上了batch normalization。细节有点多,但具体的功用是让神经网路知道自己应该什麽时候做normalization(正规化,模型收敛)或是什麽都不做。也因为这样,所以移掉了负责防止过拟合(训练时100分考试不及格的小废废)的Dropout layer。
  1. YOLO v3:
  • 使用Darknet-53,并且再加53层的训练检测。比起V2增加了更多层数,因此牺牲了速度,并提升了精度。
  • 使用Bounding Box Prediction,用来预测某bounding box是target的机率有多大。
  • 使用Binary Cross Entropy取代softmax对bounding box分类。原本softmax预设每个bounding box只有一个类别,但现实中常常会有重复、同一Bounding Box有两种类别的情况。
    像是可爱的阿福https://ithelp.ithome.com.tw/upload/images/20210904/20140460zPFpCUF4cj.png身上有大ㄐ— 咳恩……. 我是说….. 大宝剑(・∀・)
  • V3还比V2多了很多预测Bounding Box的scale,V2原本只有 1313,V3变成有1313 . 2626 . 5252等多种scale,使得V3比V2有更好的判断细小特徵的能力。
  1. YOLO v4:
    比起V3,在保证速度的情况下,使精度大幅度上升,上图
    https://ithelp.ithome.com.tw/upload/images/20210904/20140460UFtscobxiN.png
    V4 : 老三阿我和你的差距大概只有那麽一点点
    https://ithelp.ithome.com.tw/upload/images/20210904/201404601MgqyiP5uM.png

参考资料:
https://mropengate.blogspot.com/2018/06/yolo-yolov3.html
https://blog.csdn.net/Prepared/article/details/107294961
https://zhuanlan.zhihu.com/p/94986199
https://medium.com/image-processing-and-ml-note/yolo-v1-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC-%E8%AB%96%E6%96%87%E6%95%B4%E7%90%86-935bfd51d5e0
https://medium.com/image-processing-and-ml-note/yolo-v2-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC-%E8%AB%96%E6%96%87%E6%95%B4%E7%90%86-a8e11d8b4409
https://iter01.com/544669.html
https://www.gushiciku.cn/pl/pnsp/zh-tw
https://medium.com/image-processing-and-ml-note/yolo-v3-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC-%E8%AB%96%E6%96%87%E6%95%B4%E7%90%86-11ee909430c8
https://medium.com/ching-i/yolo%E6%BC%94%E9%80%B2-3-yolov4%E8%A9%B3%E7%B4%B0%E4%BB%8B%E7%B4%B9-5ab2490754ef


<<:  D3 - 第一周 暖身周 (摘要 & 提醒)

>>:  【履历要点 i 】来自大公司资深 Recruiter 的建议

[Day29] CI /CD with GitLab CI

credit: https://medium.com/@brilvio/how-i-impleme...

Day 26: 策略和层级、业务规则 (待改进中... )

「软件系统是策略(Policy)的陈述。电脑程序是将输入转换为输出的『策略的详细陈述』」 「会因着...

行政调查(administrative investigation)

-证据大图 行政调查是内部调查。 调查(Investigation) 调查:调查或研究,检查与某事...

Day-26 修改Icon

昨日提及如何於程序内显示图片, 而今天要介绍的内容同样与图片有关, 那就是如何修改App的Icon。...

[Day17] 基本移动

今天只是单纯想让我的们角色动起来,结果又又又又卡在奇怪的地方了,方向感觉对了,但有很多东西要修。 今...