Day 13 - 影像辨识介绍

目前电脑辨识影像有以下几种

  • Object Detection(物体识别)
  • Style Transfer(风格转移)
  • Image Segmentation(图像分割)
  • Pose Estimation(姿态估计)
  • Multiple Object Tracking(视频跟踪)
  • Image Generation(影像生成)

https://ithelp.ithome.com.tw/upload/images/20201211/20130601ej50xtDpoj.png

Object Detection(物体识别)

物体识别指的是让计算机(computer)去分析一张图片或者一段视频流中的物体,并标记出来,这需要给神经网络大量的物体数据去训练它才能进行识别。
Ex:在图片中侦测出脚踏车和狗狗,并标记出来。

Style Transfer(风格转移)

风格转移是指一类操纵数字、图像或视频的软件算法,以采用另一种图像的外观或视觉风格,例如将名画的外观转移到用户提供的照片上。
Ex:将梵谷的画风转移至照片上。(包括色调、线条粗细等。)

Image Segmentation(图像分割)

图像分割指的是将图像细分为多个图像子区域的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。图像分割通常用於定位图像中的物体和边界(线、曲线等)。
Ex:分析车子周围的各种物件,并保持安全距离(运用於自动驾驶等。)

Pose Estimation(姿态估计)

利用某种几何模型或结构来表示物体的结构和形状,并通过提取某些物体特徵,在模型和图像之间建立起对应关系,然後通过几何或者其它方法实现物体空间姿态的估计。这里所使用的模型既可能是简单的几何形体,如平面、圆柱,也可能是某种几何结构。来源

Multiple Object Tracking(视频跟踪)

视频跟踪是使用相机随时间定位移动物体的过程。它有多种用途,其中包括:人机交互,安全和监控,视频通信和压缩,增强现实,交通控制,医学成像和视频编辑。

Image Generation(影像生成)

根据描述生成逼真的图像非常困难,并且需要多年的图形设计培训。 在机器学习中,这是一个生成任务,比判别任务更具挑战性。参考

後记

如果想要做自动驾驶,那你就需要 image segmentation 来帮助你判断图片中 哪里是路 哪里是路人 哪里是前车。

如果你想要做美图修修的app 那你就需要style transfer 来帮你用图片做滤镜,所以其实常常input是图片的状况很多。

以上前面提到的DNN(Deep Neural Network, 深度学习)无法满足, 你应该会想问 为甚麽不能用DNN呢?DNN不是很厉害什麽都可以解决吗?

注:本文是搜寻数个网站及各种不同来源之结果,着重在学习,有些内容已难办别出处,我会尽可能列入出处,若有疏忽或出处不可考,请联络我, 我会列入, 尚请见谅。

<<:  Redis 发布订阅消息对列实作(Python)

>>:  Gulp 压缩优化程序码(2) DAY89

ASP.NET MVC 从入门到放弃(Day14)- Html Css 结构介绍

接下来讲讲 html + CSS + javascript + bootstrap基本介绍细节部分 ...

JAVA - JAVA Log4j 专门用於 Java 语言的日志记录工具

JAVA - JAVA Log4j 专门用於 Java 语言的日志记录工具 参考资料 参考资料1:L...

30 | WordPress 区块编辑器 | 延伸相关参考资料列表:

为了让这个教学系列可以适合持续变化的社会变化,会这最後这篇预留更新扩展的资源列表,会不停时更新在这个...

day 2 - 先看清楚目标的样子再动手

画流程图是我的第一堂程序课内容,大学教授讲了很多话,我记得的寥寥无几,其中一句话是:你画的出来就写得...

JavaScript学习日记 : Day14 - 原型与继承(一)

在写程序时,我们经常会想要拓展一些东西。 例如我们有一个user object,他有自己的属性跟函数...