第四个范例跟机器视觉与影像辨识有关, 我们先来了解一下什麽是机器视觉.
机器视觉想要做的事情是模仿人类的视觉能力, 让机器也能够了解影片或图中的内容, 例如机器能够知道影片或图片中有没有某种特定的物体.
规则式判断
机器视觉的应用很早就开始, 例如工厂将机器视觉应用在瑕疵检测
, 以自动化的方式取代(或辅助)人工检测.当时的应用以规则式(rule-based)为主, 也就是必需告诉电脑如何判断不同种类的规则内容, 这样电脑在取得影像之後就能协助判断规则是否成立, 达到自动检测的效果.
以影像的实作面来说, 最常使用的是OpenCV. OpenCV是Intel所开发并开源的专案, 专门用来处理影像或图档, 例如图档的平移
、旋转
、水平翻转
、影像缩放
、裁剪
、亮暗调整
、影像膨胀
、侵蚀
与透视转换
等功能.
但以规则式(rule-based)的方式执行影像处理, 只能处理规则有写到的状况, 若遇到新的状况则需要以人工的方式调整规则之後才能处理新的状况.
类神经网路
近年来, 随着机器学习在影像处理的能力有着显着的增长, 尤其是卷积神经网路(CNN)很适合处理影像领域的资料, 因此影像辨识
成为机器学习很热门的领域.
在影像辨识应用中可分为下列四类
OpenCV与类神经网路的关系.
虽然OpenCV的规则式判断方法较不具弹性, 但OpenCV的强项是图档的处理. 因此现在一般在做影像处理时, 仍然会套用OpenCV的套件来处理图档, 然後再以CNN进行模型的训练, 两者是相辅相成的关系.
在处理机器视觉
任务时, 以目前影像辨识的处理方式(也是Nilvana的方式)通常会包含下列流程:
下一篇我们将使用nilvana执行第一个步骤取得影像或图档
.
>>: Day21 类别与物件--魔术方法construct and deconstruct
今日练习档 ԅ( ¯་། ¯ԅ) 是的,今天即将延续昨天的部分继续设计Excel图表,如果您还没有看...
Javascript是一种直译式语言,直译式就是在执行时会一行一行的动态直译然後执行,在执行上速度会...
其实原本最初规画想要做Index方式的纪录,然後多增加一些没写到的面向 不过,总是计画赶不上变化 ...
原本是个程序麻瓜 经过了三个月的淬炼 稍微有了一点概念 中间过程中十分痛苦 一度让我以为我原来不会G...
连续 30 天不中断每天上传一支教学影片,教你如何用 React 加上 Firebase 打造社群...