【第1天】前言

背景

  1. 曾任职被动元件厂的品保工程师,鉴於以往资料分析无法满足庞杂的资料与客户端需求,希望培养资料洞察力与建模预测能力,到资策会AI/Big Data资料分析班进修,初步认识这个领域。
  2. 在进修期间确立了往资料科学发展的想法,在朋友的推荐下,开始到Kaggle Playground Competitions寻找有兴趣的主题(主要是影像辨识),参考前辈们的解题逻辑自己摸索。
  3. 目前程度大约是:观察资料集与确定目标後(ex.多元影像分类),可以自己安排资料清洗方式与模型训练流程,及尝试可能的模型优化方法。
  4. 「一个好的工程师,必须有自己的Side projects。可以是磨练新技术,或是解决生活中遇到的问题」。因此,我找了以前的夥伴组队报名2021年的玉山人工智慧挑战赛,才有了这系列的文章。

参赛契机

  1. 玉山人工智慧挑战赛结束後,想找时间汇整竞赛历程和学习成果,但总是提不起劲。频繁使用阿Q的精神胜利法安慰自己:「工作太忙、假日要适度休息...」,就这样延宕了3个月。恰逢iThome铁人赛,需要连续30天写作分享,故把握这次机会,强迫自己走出舒适圈。
  2. 从一开始接触Deep learning影像辨识,追随前辈们步伐的懵懂前行,到伙伴们合力完成玉山AI竞赛。藉由此次的沉淀,跟大家分享中文字辨识可能遇到的问题与解决方式,希望可以抛砖引玉、教学相长。

主题介绍

  1. 名称:玉山人工智慧挑战赛2021夏季赛-中文手写影像辨识
  2. 期间:4/12/2021-6/18/2021
  3. 内容:
    • 主办单位提供约七万张手写中文字图档,每个图档命名对应该中文字。参赛者透过CV演算法,精准辨识图片内手写文字。
    • 需要辨识的中文字共有800个,当该图档文字「无法辨识」或「不属於800字的任何一类」,须判定为isnull(其他类别)。
    • 需要将训练好的模型打包,在Google Cloud Platform部属API Server,提供手写中文字辨识服务。

小结

  1. 第1天的前情提要到此告一段落,接下来准备踏入影像辨识的领域。
  2. 请大家多指教,有任何问题或建议,欢迎留言讨论。
  3. 由於撰文时间紧凑,实作的完整程序码,会缓慢更新到GitHub上,请多见谅。

<<:  [Day8] Git学习笔记 -RE篇(MacOS)

>>:  Day 1 转职之路

[Day 14 - 小试身手] 用HTML、CSS、JS打造个人网站 (1)

所有的网站大概可以分成两类:静态网页、动态网页,静态网页顾名思义就是静止的网页,不会去太频繁的更新内...

python ModuleNotFoundError

python中引用不同文件夹下面的函数的时候,使用了__init__.py依然没有用,後来发现原因:...

【第六天 - vim 备份泄漏】

Q1. vim 是什麽? 简单来说, vim 是一种纯文字编辑器,是从 vi 发展出的增强版,而 v...

C++语言和你 SAY HELLO!!

第三天 各位点进来的朋友,你们好阿 小的不才只能做这个系列的文章,但还是希望分享给点进来的朋友,知道...

day2_arm 与 x86 的意思与特色

cpu 的架构是指什麽? cpu 是电脑作爲逻辑处理的重要核心,而我们会需要特殊的语言与 cpu 对...