最小平方法 | ML#Day16

wiki页面:最小平方法

详细的内容就不在这里赘述了,这里依旧是介绍一点简单的概念。

为什麽我们要提这个东西呢?因为需要稍微知道为什麽模型的结果无法那麽完美,而且我们在追求的东西只是一个近似值,近似值并非不好,因为是个有科学根据,数学验证过出来的结果。

由图可知,其实几乎每个资料点,都不会刚刚好的出现在线上。

不是偶尔有误差,而是大部分的时候结果都是有误差,这个观念可能要特别注意。

既然误差不可避免,可以的话当然希望误差越小越好,而误差也不能只看一个单点,要把所有的点预测值和每个点的实际值,所总和出来的误差再除以平均数量,就是损失函式的概念。

最小平方法是损失函式的其中一种方法,也是比较基本和好理解的概念。

如上图,我们的点可能出现在线的右边或者左边,如果以线所在的位置为中心点,资料点有误差,落在右边为正数;资料点有误差,落在左边则为负数;那麽如此一来我们把所有误差做加总的时候,就会发生正负相抵的状况。

这样的数学运算,会默默地抵销实际上的误差数字,并不是我们想要的,那麽把每个误差值,无论正负都先乘以平方,所有的数字就变成一定会用正数做运算。

虽然知道数值其实是实际的平方倍,然後这也不失为一个评估用来预测的线,与实际值得落差有多大,因为原本的误差越大,得到的平方数字当然也跟着越大,一但有办法缩小误差,平方出来的数字也就跟着越小罗。

所以训练出来的模型,可以用一些数学的方法验证可靠性程度,或者用某些方式评估模型的好坏,因此结果有所价值,但是要能够完全精准的百分百达到零误差的状况,几乎是不可能状况。

理解模型的极限与适用性,不要有过度的期待,了解可以带来的价值,毕竟有些事情单靠人脑难以企及,也许更有机会在我们这些未曾使用ML的团队上,落地实用化并享受AI的好处。


<<:  DAY12 - 踩坑纪录 : Bitbucket

>>:  Day10 Vue模板语法 & V-text、V-html、V-once介绍

高并发下的资料库状态

今天我们要来讨论高并发下的资料库考量 Day03_高并发下的资料库考量 ...

电子书阅读器上的浏览器 [Day22] 翻译功能 (IV) 内容分页

将网页原文分页翻译 大致上的实作,到上一篇就差不多了。但是在使用几天後发现一个问题,如果文章内容太长...

[Day 08] 使用 fastAPI 部署 YOLOv4 (2/2) — 自行撰写 Client 进行互动

前言 昨天我们使用了 fastAPI 内建 client 的 UI 来与 API 互动,今天我们改为...

[Day 26] Android Studio 七日陨石开发:嘘! 我正在监听这个元件

前言 昨天我们设计好UI介面後, 我们有一堆按钮和文字框的"元件", 要让这些元...

TOGAF架构框架

TOGAF由国际标准权威组织The Open Group制定。The Open Group於1993...