Day2 - Yolo? 那是什麽? 能吃吗?

今天要介绍的是Object detection(物件侦测)以及CNN (Convolutional Neural Network , 卷积神经网路)

首先是Object detection :
也就是物件侦测,通常会由

  • Object Localization (物件定位)
  • Feature Extraction (特徵提取)
  • Image Classification (图像分类)
    三者组合而成,换句话说
    「哪里有东西,这东西有啥特徵,我觉得这东西是啥」 = 我找到这东西了 !

CNN (卷积神经网路):
CNN是深度学习的其中一种架构,被广泛的使用在物件辨识以及图片处理等领域。

而CNN会由3个步骤组成

  • Convolution Operation (卷积)
  • Pooling (池化)
  • Fully Connected Networks (全连接)
  1. Convolutional Operation
    在第一步会进行卷积,抓取图片中的特徵。在影像辨识时,要使用影像中的全部pixel进行辨识是不现实的。比较合理的做法是抓出影像中重要的地方,将这些特徵(feature maps)保存起来,之後才让训练决定特徵点的去留。

举个例子:
https://ithelp.ithome.com.tw/upload/images/20210902/20140460kA5tscTuGa.jpg(X

如果拿JOJO中的经典人物DIO来看(不考虑子安武人的魔性配音σ`∀´)σ)
原图是
https://ithelp.ithome.com.tw/upload/images/20210902/20140460Wq3wtQZ3uv.jpg

经过挑选後的特徵可能剩下
https://ithelp.ithome.com.tw/upload/images/20210902/20140460FKLzk3wo0X.jpg

  1. Pooling
    因为现实世界有太多的变因能够影响影像的成像品质,而这些因素都能让电脑出现误判的情况,因此在池化这步将会让神经网路有能力处理这些特徵。

现实中的变因 ᕕ ( ᐛ ) ᕗ
https://ithelp.ithome.com.tw/upload/images/20210902/20140460GeTEmwrrUR.jpghttps://ithelp.ithome.com.tw/upload/images/20210902/201404605iwdmsITdD.jpghttps://ithelp.ithome.com.tw/upload/images/20210902/2014046023aUoPKxeC.jpg

而pooling又分为:

  • Mean pooling
  • Max pooling
  • Sum pooling
    这里用最常用的Max pooling举例,他就是挑选出前一步产出的Feature maps矩阵内的最大值。使用Max pooling的好处是平移不会对判断造成影响,也因为是挑最大值,所以基本上不会挑中比重小的值,自然抗杂讯能力也就好。
  1. Fully Connected Networks
    在这步(全连接网路)会把前几步得到的网路进行平坦化(Flatten)的动作,变成一个很神奇的物体。
    https://ithelp.ithome.com.tw/upload/images/20210902/20140460sisRicWavi.png
    像这样,经过三步之後,CNN就算是完整的介绍完了。

参考资料:
https://medium.com/@chenchoulo/yolo-%E4%BB%8B%E7%B4%B9-4307e79524fe
https://ithelp.ithome.com.tw/articles/10204738
https://ithelp.ithome.com.tw/articles/10204737
https://medium.com/jameslearningnote/%E8%B3%87%E6%96%99%E5%88%86%E6%9E%90-%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92-%E7%AC%AC5-1%E8%AC%9B-%E5%8D%B7%E7%A9%8D%E7%A5%9E%E7%B6%93%E7%B6%B2%E7%B5%A1%E4%BB%8B%E7%B4%B9-convolutional-neural-network-4f8249d65d4f


<<:  第51天~

>>:  DAY 2 HTML 的基本语法

Day 10:Component, Component, Component

前面的文章匆忙带过 MainWindow,建议从官方的文件再深入理解 JUCE Applicatio...

第 7 集:你有 Flex Style 吗?

此篇会简单介绍 FlexBox,以及 flex container 的排列方向设置、对齐设置技巧。 ...

Unity自主学习(二十七):物件跳跃

那麽今天来试着弄出用"空白建"控制物件跳跃的脚本内容吧! 那之前因为都是平面移动,所以我是想着改变座...

Day 29 : 第一个无线智慧装置

网页服务器 学习了快一个月後总算可以来撰写无线的智慧装置, 相信利用这些技术肯定能提升你的育儿体验,...

SQL server 启用 IFI 功能 - 心得分享

DBA Bootcamp 今天早上 Data warehouse 部门的人告诉我平常的 Data l...