[D26] 物件侦测(7)

YOLO 是一个不断改进和优化的物件侦测系列，除了前三个版本，在 2020 年时，YOLOv4 也问世了！
YOLOv4 是至今最快、精准度最高的物件侦测系统，除了即时侦测车流速度之外，甚至能辨识并捕捉高速滑雪运动中的人与物体。

据作者表示，其实 YOLOv4 是不小心产生的，为什麽这样说呢？

当初有企业询问中研院资讯所：如何改善十字路口的交通分析？
研究团队构想要完成鱼眼车流分析、多摄影机行人识别技术、行动装置人脸防伪技术，最後锁定路口以科技执法来揪出违规车辆。

团队部署了鱼眼镜头，实际测试用来分析车流量的演算法，并根据侦测到的数据，来调整交通号志灯号。
他们进行了停等车队与车速、车流的分析，加上当时枪型摄影机所搭配的物件侦测演算法 → 这些实作就是「意外发展出来的 YOLOv4」。

Yolov4本质上和Yolov3相差不大，主要也是加快速度和辨识的准确度，怎样改善後可以大幅提升表现呢？

关键是：学习的反馈过程。当卷积神经网路的网路层数愈多，在训练阶段，因为反馈计算方式，每回传一层就会损失一些资讯，越前面的网路层学习到的东西越少，称为「梯度消失问题」（vanishing gradient problem）。

黑色箭头：CNN 运行方向；红色箭头：CNN 的学习反馈方向

为了解决梯度消失问题，前人曾经提出 ResNet 卷积神经网路来解决，就是将後面资料备份後往前＂跳级＂传递。
但是 ResNet 具有太多重复的拷贝，每一层能学到的东西都差不多。

跳级：从最後一层开始，每一层都备份，再把备份越过一层传递，前面网路层就能接收到後面的资讯！

因此，在 PRNet 的基础上研发出＂跨阶段局部网路＂ CSPNet（cross stage partial network, CSPNet），利用分割–分流–合并的路径，成功达到了大幅减少计算量、却能增加学习多元性的目标。

PRNet：局部残差网路（partial residual networks），将资讯「分流」，减少无谓的计算量，使运算速度增加两倍。

因为使用了 CSPNet ，YOLOv4 可即时侦测人们的社交距离，或是快速判断路上的行人有没有戴口罩，为社会带来很多便利！