[Day2] 电脑视觉下的人脸

万般皆是脸

注：在接下来的内容里，我会着重在"图片"下的人脸辨识 (包含摄影机图片串流处理)，3D影像或其他非图片类型的本人还未着墨，因此不会在这个系列内容中说明。

注2：本篇文章着重在接下来系列文的基础知识，如果这些对你来说太简单了，可以斟酌跳过 :)

本文开始

以下面年轻时的卓别林照片来说：

reference: 维基百科 - 查理·卓别林

这张照片有几个资讯：

大小是宽高比 540 x 720 px (单位为像素，好奇的邦友可以按F12打开开发者工具检查)
照片是灰阶照片 (也就是只有一种颜色表示的图片：黑色)
~~卓别林年轻时真帅~~

若将上述的资讯用电脑能够理解的资料储存，以矩阵来表示会看起来像这样：

matrix

若用numpy array的方式表示会长这样 (numpy是Python中很常用的矩阵与数值函式库，这里可以先不管)：

[[ 67  69  65 ...  60  58  60]
 [ 63  62  67 ...  60  58  59]
 [ 64  59  68 ...  54  54  55]
 ...
 [210 211 209 ...  23  20  21]
 [204 210 216 ...  19  15  16]
 [209 203 213 ...  24  18  17]]

到目前为止我们知道：

电脑在处理图片时通常会用pixel(像素)来作为基本的单位处理内容 (所以这张照片就有540x720=388800个像素)
每个像素的值范围是 [0, 255] (灰阶图片来说，数值越大颜色越浅；255代表白色)
~~卓别林年轻时真的很帅~~

因此，如果是一个彩色图片：
彩色卓别林

为了要表示色彩空间，我们用大家所熟悉的三原色(RGB)来表示这张图片的话：
matrix
图片上半部依序由左至右为图片仅红色部分、图片仅绿色部分、图片仅蓝色部分

那下半部的三张图片呢？
还记得前面提到灰阶图片表示，数值范围是从 [0, 255] 吧？

因此下半部三张图可以想成把三原色(RGB)分别以灰阶数值来表示
头晕了吗？

举例说明：

在左下的图红色部分以灰阶表示中，可以看到卓别林的脸部部分比起其他下半部的图都是特别的亮：
- 意思是脸部部分红色色彩大多都接近255 (0 ~ 255 是从黑到白)；也就是脸部主要是用红色表示
  (上半部分图片由於人对不同颜色的差异感知不同，因此红色部分很难看出脸部比较"亮")
衣服部分可以看出"蓝色图片那张都比较黑" (下半部蓝色部分以灰阶表示的图片，对应的地方则是黑色比较多)：
- 意思是原图衣服部分很少有蓝色的像素存在

以上的范例说明希望能让你对"颜色以数值表示"有一些感觉。
当然，没有很理解也不会影响接下来的主题就是。

最後，图片的原始大小为510 x 706，而图片是彩色的就表示要用三个510 x 706的矩阵来表示：
510 x 706 x 3

用numpy来查看图片的"大小"的话：