Day 14 - 安装与执行 YOLO

Day 14 - 安装与执行 YOLO

介绍影像辨识的处理流程 - Day 10 有提到 YOLO 模型是由 Joseph Redmon 所提出,而到了 YOLOV4 後才换成另外一群人继续发展,YOLOV4 的作者是 Alexey Bochoknovskiy, Chien-Yao Wang, 与 Hong-Yuan Mark Liao,YOLOV5 的作者 Glenn Jocher

安装 YOLO

今天会将 YOLOV3 安装在 Amazon Linux 2,首先从 Joseph Redmon 所建立的 Darknet 进入安装步骤,首先去 darknet 的 github 官网下载套件,接着修改 Makefile 编译组态档,将 GPU,CUDNN 打开,因为这个版本的 AMI 已经有安装 CUDA 等驱动程序,此外还要设定 GPU 架构,因为 gx4n 这类 EC2 使用的是 Tesla T4 的 GPU,所以要去查相对应的架构,可以在 Matching CUDA arch and CUDA gencode for various NVIDIA architectures 这个网站中查到,下图中一个显示 Makefile 的内容,一个透过指令来查 GPU 的使用状况。

git clone https://github.com/pjreddie/darknet.git
cd darknet
# 检查 GPU 的型号与记忆体容量
nvidia-smi
# 修改 Makefile 编译组态档
vi Makefile
make

Makefile

GPU=1 # enable GPU
CUDNN=1 # enable CUDNN
OPENCV=0
OPENMP=0
DEBUG=0

ARCH= -gencode arch=compute_30,code=sm_30 \
      -gencode arch=compute_35,code=sm_35 \
      -gencode arch=compute_50,code=[sm_50,compute_50] \
      -gencode arch=compute_52,code=[sm_52,compute_52]\
      -gencode arch=compute_75,code=[sm_75,compute_75]
# for Tesla T4

https://ithelp.ithome.com.tw/upload/images/20210914/20129510EHxwz7nPbK.png
图 1、修改 Makefile 设定

https://ithelp.ithome.com.tw/upload/images/20210914/20129510fnhQQVjXCg.png
图 2、检查 GPU 的型号与记忆体容量

执行 YOLO

执行 yolov3 演算法,用来辨识 dog.jpg 这张图片,使用的是事先训练好的模型 yolov3.weights,采用 cfg/yolov3.cfg 的组态设定。

# 下载预先训练好的权重模型
wget https://pjreddie.com/media/files/yolov3.weights
# 注意一下执行的所在文件夹应为 /home/ec2-user/fishRecognition/fishsite/darknet
./darknet detector test cfg/coco.data cfg/yolov3.cfg yolov3.weights data/dog.jpg

下图中可以看出来,总共辨识出三种物件,分别是狗、卡车跟脚踏车,所花的辨识时间为 0.0934 秒,主要是因为有开启 GPU。

https://ithelp.ithome.com.tw/upload/images/20210914/201295109rxALS64rm.png
图 3、利用预先训练好的模型来辨识图片

下图为待预测的图片 data/dog.jpg。

https://ithelp.ithome.com.tw/upload/images/20210914/20129510ef7hyKKwjH.jpg
图 4、待预测的图片

下图为预测後的图片,预设会存为 predictions.jpg。

https://ithelp.ithome.com.tw/upload/images/20210914/20129510mKEV1CODNk.jpg
图 5、预测後的图片

而之所以会辨识为 dog, truck, bicycles,是在 cfg/coco.data 内定义的。

使用 Python 执行 YOLO

我们这里用的方法并不是全部用 Python 重写一遍,而是在 Python 中呼叫 c 语言所提供的呼叫介面,存取 libdarknet.a 这个静态函式库。

darknet 已经将 Python 呼叫 C 语言函式库的介面写好了,放在 python/darknet.py 这个档案里,唯一需要修改的是将 154 行中的语法改成 Python 3的语法,如下图所示。

https://ithelp.ithome.com.tw/upload/images/20210914/20129510xitya3Pwvv.png
图 6、修改 darknet.py 的代码

接着撰写 fishRecognition.py 这个档案,就是把命令列中的参数,都直接放到 Python原始码内就可以。最後呼叫 dn.detect 方法来进行预测。

fishRecognition.py

# 引入 python/darknet.py 
import python.darknet as dn
from datetime import datetime

print('load view model')
net = dn.load_net(str.encode("./cfg/yolov3.cfg"),
                  str.encode("./yolov3.weights"), 1)
meta = dn.load_meta(str.encode("./cfg/coco.data"))
print('start to predict...\n')
n = datetime.now()
r = dn.detect(net, meta, str.encode("./data/dog.jpg"))
print(r, '\n', datetime.now()-n)

下图是执行结果,不只是得到每个物件的名称,准确度,还有方块框的座标,最後一个是我们写来判断预测所花的时间,约 0.11 秒

https://ithelp.ithome.com.tw/upload/images/20210914/20129510OII5bRSHTE.png
图 7、使用 Python 语法呼叫 darknet 函式库

参考资料


<<:  Day 0x4 - 请求 API 前的前置动作(Part 1)[Nonce, Hash Id, Sign]

>>:  Day9:Job vs SupervisorJob

伸缩自如的Flask [day9] request

在这里多看一下request,在前面的几篇文章中我们已经看过了他的身影,这里我们可以看一下它不同的属...

Day 30. 要怎麽动

啊哈,所以理论上我的第一个菜单做好了,但是因为我做的是VR菜单,所以移动手臂要靠Tracked Po...

【後转前要多久】# Day07 CSS - 打架该听谁的?CSS权重、继承

虽然这章节可能有些无聊,迟迟没进入CSS引人兴趣的地方, 但我还是想依我学习时,所想到和纳闷的事物按...

day28: Pointfree

今天要来补充 Pointfree 的概念, 这也同样和 pipe 有关。 function 运算的过...

Day07 - Python基本语法 Part 4,模组、档案处理与多执行绪

范例程序主要来自於W3Schools。 模组 建立模组:新增一个.py档,使用欲使用的模组名称命名(...