[Day 24] Facial Landmark: MTCNN

侦测人脸位置与人脸关键点，两个混合在一起

MTCNN -- Multi-task Cascaded Convolutional Networks

从完成名称可以看出一些端倪：

多任务 (multi task)：同时学习侦测人脸与辨识人脸关键点任务
级联 (Cascade)：与Day9的哈尔特徵检测法一样，使用每一层计算的输出当作下一层的输入，从简单的判断开始去除不需要的区域，再慢慢深入去判断需要的结果
卷积网路 (Convolutional network)：Day 18已简单说明过，就是影像处理最常用到的神经网路结构

到这里你已经知道MTCNN的精随了，剩下的就是如何训练MTCNN。

但这部分是需要精心设计训练资料，以及分阶段训练MTCNN (P-Net -> R-Net -> O-Net)，

这里我们只专注在如何使用，

Let's Go!

本文开始

开启专案，在facial_landmark目录下新增mtcnn_predictor.py
在你的Python环境中安装
- mtcnn (版本：0.1.1)
- tensorflow (任意2.0以上版本)

打开mtcnn_predictor.py，输入下面到目前为止最简单的程序码：

import time

import cv2
import mtcnn
from imutils.video import WebcamVideoStream


def main():
    # 初始化模型
    detector = mtcnn.MTCNN()

    # 启动WebCam
    vs = WebcamVideoStream().start()
    time.sleep(2.0)

    while True:
        frame = vs.read()
        rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        faces = detector.detect_faces(rgb)
        for face in faces:
            (x, y, w, h) = face['box']
            keypoints = face['keypoints']
            conf = face['confidence']

            cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2)
            cv2.putText(frame, f"confidence: {str(round(conf, 3))}", (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 255), 2)

            for (s0, s1) in keypoints.values():
                cv2.circle(frame, (s0, s1), 2, (0, 0, 255), -1)

        cv2.imshow("Frame", frame)
        key = cv2.waitKey(1) & 0xFF
        if key == ord("q"):
            break

    # 清除用不到的物件
    cv2.destroyAllWindows()
    vs.stop()


if __name__ == '__main__':
    main()