[D26] 物件侦测(7)

YOLO 是一个不断改进和优化的物件侦测系列,除了前三个版本,在 2020 年时,YOLOv4 也问世了!
YOLOv4 是至今最快、精准度最高的物件侦测系统,除了即时侦测车流速度之外,甚至能辨识并捕捉高速滑雪运动中的人与物体。

小意外

据作者表示,其实 YOLOv4 是不小心产生的,为什麽这样说呢?

当初有企业询问中研院资讯所:如何改善十字路口的交通分析?
研究团队构想要完成鱼眼车流分析、多摄影机行人识别技术、行动装置人脸防伪技术,最後锁定路口以科技执法来揪出违规车辆。

作法

团队部署了鱼眼镜头,实际测试用来分析车流量的演算法,并根据侦测到的数据,来调整交通号志灯号。
他们进行了停等车队与车速、车流的分析,加上当时枪型摄影机所搭配的物件侦测演算法 → 这些实作就是「意外发展出来的 YOLOv4」。

YOLOv4 架构

Yolov4本质上和Yolov3相差不大,主要也是加快速度和辨识的准确度,怎样改善後可以大幅提升表现呢?

关键是:学习的反馈过程。当卷积神经网路的网路层数愈多,在训练阶段,因为反馈计算方式,每回传一层就会损失一些资讯,越前面的网路层学习到的东西越少,称为「梯度消失问题」(vanishing gradient problem)。

黑色箭头:CNN 运行方向;红色箭头:CNN 的学习反馈方向

为了解决梯度消失问题,前人曾经提出 ResNet 卷积神经网路来解决,就是将後面资料备份後往前"跳级"传递。
但是 ResNet 具有太多重复的拷贝,每一层能学到的东西都差不多。

跳级:从最後一层开始,每一层都备份,再把备份越过一层传递,前面网路层就能接收到後面的资讯!

因此,在 PRNet 的基础上研发出"跨阶段局部网路" CSPNet(cross stage partial network, CSPNet),利用分割–分流–合并的路径,成功达到了大幅减少计算量、却能增加学习多元性的目标。

PRNet:局部残差网路 (partial residual networks),将资讯「分流」,减少无谓的计算量,使运算速度增加两倍。

因为使用了 CSPNet ,YOLOv4 可即时侦测人们的社交距离,或是快速判断路上的行人有没有戴口罩,为社会带来很多便利!

图片来源
论文


<<:  Day 26 - 用canvas 做颜色游戏

>>:  【day26】Span翻转TextView

连续 30 天 玩玩看 ProtoPie - Day 26

https://www.protopie.io/blog/keyboard-shortcut-tip...

{DAY 25} Matplotlib 基础操作

前言 今天这篇要进入到资料视觉化 在前几篇的文章里,资料的形式多半是呈现在表格化的资料表上 为了让数...

[D03] 取样与量化(1)

我们在用电脑处理影像时,由於电脑只看得懂数字,所以影像必须要以离散(discrete)的形式处理,也...

在国外的我如何跟客户联系

关於联系方式,我分成三种等级: 即时:line/messenger 通话、电话、已读的 line 等...

WordPress 适用响应式(RWD)浏览图片灯箱效果外挂-WP Lightbox 2

WP Lightbox 2 是一款支援图片灯箱效果,点图放大附关闭功能的外挂,适合在响应式网页上使用...