Day 13 - 影像辨识介绍

目前电脑辨识影像有以下几种

物体识别指的是让计算机(computer)去分析一张图片或者一段视频流中的物体，并标记出来，这需要给神经网络大量的物体数据去训练它才能进行识别。
Ex:在图片中侦测出脚踏车和狗狗，并标记出来。

风格转移是指一类操纵数字、图像或视频的软件算法，以采用另一种图像的外观或视觉风格，例如将名画的外观转移到用户提供的照片上。
Ex:将梵谷的画风转移至照片上。(包括色调、线条粗细等。)

图像分割指的是将图像细分为多个图像子区域的过程。图像分割的目的是简化或改变图像的表示形式，使得图像更容易理解和分析。图像分割通常用於定位图像中的物体和边界（线、曲线等）。
Ex:分析车子周围的各种物件，并保持安全距离（运用於自动驾驶等。）

利用某种几何模型或结构来表示物体的结构和形状，并通过提取某些物体特徵，在模型和图像之间建立起对应关系，然後通过几何或者其它方法实现物体空间姿态的估计。这里所使用的模型既可能是简单的几何形体，如平面、圆柱，也可能是某种几何结构。来源

视频跟踪是使用相机随时间定位移动物体的过程。它有多种用途，其中包括：人机交互，安全和监控，视频通信和压缩，增强现实，交通控制，医学成像和视频编辑。

根据描述生成逼真的图像非常困难，并且需要多年的图形设计培训。在机器学习中，这是一个生成任务，比判别任务更具挑战性。参考

如果想要做自动驾驶，那你就需要 image segmentation 来帮助你判断图片中哪里是路哪里是路人哪里是前车。

如果你想要做美图修修的app 那你就需要style transfer 来帮你用图片做滤镜,所以其实常常input是图片的状况很多。

以上前面提到的DNN(Deep Neural Network, 深度学习)无法满足, 你应该会想问为甚麽不能用DNN呢？DNN不是很厉害什麽都可以解决吗？