Day 26 | Overfitting v.s. Underfitting

我们已经学会了运用画出图表的方式来检视模型的训练过程,有时候图表曲线所呈现的结果相当理想,和我们预想的情况相差不大,但也有时候会出现比较有趣的特殊情形,彷佛在告诉我们模型的训练有些异常,今天就来简单介绍两种模型训练可能出现的特别现象。

在我们用AI做机器学习并进行辨识及预测时,就不能不提到两个专有名词:OverfittingUnderfitting

  • Overfitting,又称为拟合过度过拟合现象:讲白话即是过度的学习训练资料,显示你把模型训练得太好了,而这里所谓训练得太好了的原因,可能是训练资料不足,或是不具有多样性,甚至是训练的次数过多或是太过彻底,导致这个模型只对於训练资料集内的数据有高准确率,但是对於未知的事物和数据则表现得特别差,就像是世界上狗的种类有那麽多,你的资料库中却只有黑色与白色的狗,一旦遇上花色的就完全认不出来。

  • 恰巧相反的则是Underfitting,又称作拟合不足:显示这个模型可能尚未训练完全,或是训练的次数不足就开始对未知的数据做预测,导致准确度大幅降低,换句较浅显的话来说,就好比请一群小学生去做AI预测一样,准确度明显偏低。

因此,我们在机器学习的过程当中,若要避免或是减轻上述两种状况的发生,在资料库的收集时,就要注意尽量包含该群组的多样性与丰富性,但是又不能包含太多细节,要给AI深度学习程序一些些的模糊空间,才会给未知的部分做出更准确的判读


<<:  DAY26: 权限总结

>>:  [Day 26] 从 AsyncPipe 出发,微探讨 Angular 处理 pipe 的流程

Day04常用的基本标签(HTML)

常用的标签 先来介绍一些常用的标签 h1、h2、h3、h4、h5、h6 ← 这六个是依序由大到小的标...

【心得】你今天青蛙了吗? Flex之路-align-items vs. align-content 傻傻分不清楚

前言 据说在好久以前(并没有多久!),在神器flex出现以前都要自己计算尺寸下去做排版 自从Flex...

物理访问控制系统(PACS)-重播攻击(Replay attack)

下图演示了针对生物识别系统的九个攻击点。从传感器到特徵提取器的生物特徵数据的回放是其中之一。 . “...

Day 15 Heroku + Flask

Heroku 的范例是使用 django + gunicorn 作为服务器的。 而我在这边要改成 f...

每个人都该学的30个Python技巧|技巧 24:超便利的内建函式—max()、min()、sum()(字幕、衬乐、练习)

昨天才发现原来我之前的影片声音都很奇怪(怎麽没有人跟我说啦 (ఠ్ఠ ˓̭ ఠ్ఠ)),所以今天调了...