资料处理
图片样本数
资料不平衡
有些字的图片张数较少,例如"仙"只有14张,而丁有100张,送入模型训练时会有比例不同的问题。
例如"士"跟"土",若"土"的图片较多,那"士"很有可能常态性的会被辨认为"土"。
解决方法
模型训练
在训练模型的时候发现,学习率非常重要,因为模型很容易落在局部最佳或者鞍点,若使用正确的更新学习率方式,可以避免出现此情况。
模型训练固然重要,但资料清洗和样本数及比例平衡才是王道。前几名的组别,样本数都是我们的好几倍,他们的模型也都跟我们一样,但是练出来就是准确度比较高。
多参加比赛,一次比赛就可以从中学到很多东西,看书搭配实作,进步更加神速。
>>: [ Day 30 ] 从 Vue.js 到 React.js 的完赛心得
ShellExView 今天来认识的小工具是看 Shell 的(猜测 ShellExView She...
这个的上一篇:https://ithelp.ithome.com.tw/articles/10258...
1. Mutex又称互斥锁。为什麽需要保护共享资源? 数据在goroutine之间共享,就有可能会出...
一家公司很难单靠一个产品来获利,就像 原来产品也有自己的生命历程 Product Life Cycl...
此篇应该接在[第五篇-资料型别]之後介绍,因为在JavaScript中,会依不同型别而有不同的传递参...