DAY12:玉山人工智慧挑战赛-中文手写字辨识(前言)

参赛契机

  • 之前参加资策会,结训时都会做个专题啦,但因为我自己对我们组的专题挺不满意,而且对於深度学习这块,资策会老师由於课堂太少,讲话跟开飞机一样快,这个部分完全没涉略到!结训後,刚好看到有这比赛,跟资策会小夥伴们就组队参加啦!

  • 想实作图像辨识,实作一次超越只看书所得到的东西,可以与队友讨论,做的结果好不好其次,还可以得到前三名的分享,我相信对於未来工作也是非常有帮助的。


比赛内容介绍

  1. 名称:玉山人工智慧挑战赛2021夏季赛-中文手写影像辨识
  2. 比赛时间:2021/4/12-2021/6/18
  3. 比赛内容:
    • 玉山提供约70000张中文手写字的图档,档名即是那个图档的字(标签)。
    • 参赛者需要辨识的有800个中文字,若图档文字非在800字内或无法辨识,则要判定为isnull。
    • 参赛者利用各种方法去做辨识,只要API不连结人工(例如:Line)皆可。
    • 将训练好的模型及完成的API,部署到Google Cloud Platform进行比赛。
  4. 比赛成绩:
    • 比赛成绩为所有参赛队伍前10%,不是特别好的成绩,但对我们来说初体验得到这样得结果,我们已经很开心了,从比赛中得到的收获更是满载而归。

观察资料集

  • 拿到资料後,我们观察到玉山给的图档里面有些许问题:

    • 空白图档
    • 一张图片多个文字
    • 标签错误
    • 图档的字不明确
  • 我们讨论过後,决定用YOLOv4来处理多字的部分,将他切割成一个字一个字。

  • 标签错误的部分,我们只能人力分工去手动更改标签。

  • 最後还会用OpenCV将边框红线部分去掉。


今日小结

  • 我怕我上述那样打好像我在黑资策会,我并没有那个意思喔!师资没问题,是因为只有半年的时间,几乎每天上课,要学程序、学资料库、学统计等等,真的很多课程很丰富,只可惜时间太少,我个人比较笨一点,吸收比较慢,我还是很感谢去资策会所学到的,以及在资策会交到共同兴趣的好朋友们,让我能在结训後还能与他们一起研究学习。
  • 今天只是先简单介绍一下,此比赛的规则及内容,明天会以资料前处理YOLOv4的部分来做分享。

<<:  Day13 hover应用(二)

>>:  [Day12] 从 function 谈变数的 Scope

Day11 远端共同协作 - 使用 GitHub

大家好我是乌木白,今天来向大家介绍GitHub,我自己很喜欢的一个可以做很多功能的网站!! 什麽是...

D3JsDay14不想图表被冰冻,那就做一点互动—事件互动

什麽是互动?简单说希望能够让使用者允许监听和分派事件,用比较白话的一点方式举例就是当我们滑鼠按下某个...

公司防火墙架设後对外网页帐号密码错误

我们公司换防火墙之後 别台电脑对子公司网站登入 网页却可以正常开启 登入却一直显示帐号密码错误 只有...

Day 27 - 工作满一年了,该离职吗?

从当初进公司没有前辈的带领以及各种专案即刻救援的摧残、体验当菜鸟业师以及超新鲜面试官的经验後,现在部...

DAY12 如何使用样板

做完大概长这样,左边的图片就会是显示在line上面的样子,有兴趣可以自己摸索一下,这边还有一个重点是...