我们已将资料集上传到 nilvana 的 Vision Studio 中, 也知道标注格式的种类与基本内容, 这篇我们来执行标注、资料前处理与资料扩增.
标注方式可分为机器标注与人工标注,Vision Studio 的机器标注提供半自动标注及全自动标注两种
接下来回到Nilvana的Dataset页面, 请点击下图的Machine Annotation
按键
在下图中, 我们择选中间的tabBuilt-in Models
, 表示我们要使用内建模型. 内建模型大部份是基於开放资料集,并经过验证与调教训练而成,包含:
有戴口罩
、没戴口罩
及口罩穿戴不正确
三种类别。在这个步骤中, 我们选择Face Mask
(口罩侦测模型), 再点击apply
键
接着要选择执行全自动标注
还是半自动标注
, 这里我们选全自动标注Automatic Annotation
针对Minimum Score Threshlod, 可以左右拉动最小机率门槛值做设定, 数值越大则误判机会越小, 但可能会漏掉一些物件.
然後进行确认要标注的标签, 在我们的范例中, 被标注为有戴好口罩的数量有2588, 没有正确戴口罩的数量有110, 而没有戴口罩的数量有484, 我们把这三个checkbox都勾起来.
然後也再点击save
键
然後即可看到自动标注後的结果, 如下图红框处
完成资枓标注之後, 以目前的图档建立一个新的版本, 版本名称为1.0.0, 图档数量为677张, 如下图所示. 但目前的图档版本品质为二格, 品质属於尚可(fair), 因此接下来我们来(1)加入更多图档, (2)使用资料前处理与资料扩增技术增加资料集的品质
为了增加图档品质, 其中一种方式是增加图档, 上传图档的方式请参考Day24的内容.
增加图档後, 图档的数量增加为1112张, 并且将版本命名为2.0.0, 如下图所示.
但增加了图档数量之後并没有增加图档品质, 图档品质仍属於尚可(fair).
前述增加图档数量之後并没有增加图档品质, 因此接下来要执行资料前处理与资料扩增, 预期资料品质会提高.
资料前处理与资料扩增是OpenCV的专长
接下来我们使用Nilvana来做resize. 首先在下图中选择Versions
页签, 然後点击Preprocessing的Add
键
然後在下图选择Resize
, 并且在右侧的下拉式选单选择Black Edge
, 表示我们要影像档固定为同一个size(288x288), 如果有多出来的部份以黑底填满. 最後再将Resize切换为enabled.
这里将资料的尺寸及类别格式统一的好处是可以帮助你减少模型训练所要花费的时间.
设定好的画面如下图所示:
接下来我们要做资料扩增, 请点击下图的Add
键
Nilvana提供多种方式, 透过小幅度的改动资料, 可以为你优质的资料增加多样性以及降低过度拟合的现象, 提高资料集整体品质. Nilvana提供以下演算法辅助你增强图像,包含:Noise, Saturation, Brightness, Hue, Flip, Exposure, Shear, Rotation, Blur, Grayscale 等。
在我们的范例中, 选择左右翻转(Flip)
再选灰阶(Grayscale)
再选旋转(Rotation)
再改变色调(Hue)
再选变亮(brightness)
这时就可以看到我们把五种资料扩增机制加进来了. 同时再把output数设定为3. 这时可以看到资料集的图片张数增加到4448张
当完成资料前处理与资料扩增之後, 就要把这组资料集给定一个版本, 这样之容易界定不同的资料集的差别, 也易於之後执行训练时选择不同版本名称就可以选到不同的资料集.
请点下图的Generate
键
输入版本编号
完成了之後, 可以看到Dataset版本已建立, 如下图. 在这个版本, 影像张数为4448张, 而且资料品质增加为三格(Good),可见资料扩增功能已有效增加dataset张数与品质.
到这里我们使用使用机器标注中的全自动标注功能完成了口罩脸孔资料集的标注, 也完成资料前处理、资料扩增与版本建立, 下一篇我们就来执行训练
<<: 找LeetCode上简单的题目来撑过30天啦(DAY24)
好的网站除了内容传达之外,颜色是进入网站的第一印象,可以针对文字大小、框线、背景色...等做变化,是...
GitHub Repo https://github.com/b2etw/Spring-Kotlin...
今天要来分享我第二年参加铁人赛的故事!这时故事的时间线已经来到去年暑假。 进入正题 去年暑假,除了做...
在 Day 05 ML 专案生命周期介绍分为 4 个阶段与 7 大主题,第 1 个阶段为「定义范畴...
官网的说明是: Rack, a modular Ruby webserver interface R...