最小平方法 | ML#Day16

详细的内容就不在这里赘述了，这里依旧是介绍一点简单的概念。

为什麽我们要提这个东西呢？因为需要稍微知道为什麽模型的结果无法那麽完美，而且我们在追求的东西只是一个近似值，近似值并非不好，因为是个有科学根据，数学验证过出来的结果。

由图可知，其实几乎每个资料点，都不会刚刚好的出现在线上。

不是偶尔有误差，而是大部分的时候结果都是有误差，这个观念可能要特别注意。

既然误差不可避免，可以的话当然希望误差越小越好，而误差也不能只看一个单点，要把所有的点预测值和每个点的实际值，所总和出来的误差再除以平均数量，就是损失函式的概念。

最小平方法是损失函式的其中一种方法，也是比较基本和好理解的概念。

如上图，我们的点可能出现在线的右边或者左边，如果以线所在的位置为中心点，资料点有误差，落在右边为正数；资料点有误差，落在左边则为负数；那麽如此一来我们把所有误差做加总的时候，就会发生正负相抵的状况。

这样的数学运算，会默默地抵销实际上的误差数字，并不是我们想要的，那麽把每个误差值，无论正负都先乘以平方，所有的数字就变成一定会用正数做运算。

虽然知道数值其实是实际的平方倍，然後这也不失为一个评估用来预测的线，与实际值得落差有多大，因为原本的误差越大，得到的平方数字当然也跟着越大，一但有办法缩小误差，平方出来的数字也就跟着越小罗。

所以训练出来的模型，可以用一些数学的方法验证可靠性程度，或者用某些方式评估模型的好坏，因此结果有所价值，但是要能够完全精准的百分百达到零误差的状况，几乎是不可能状况。

理解模型的极限与适用性，不要有过度的期待，了解可以带来的价值，毕竟有些事情单靠人脑难以企及，也许更有机会在我们这些未曾使用ML的团队上，落地实用化并享受AI的好处。

杂谈

杂谈

杂谈

杂谈

杂谈

今天我们要来讨论高并发下的资料库考量 Day03_高并发下的资料库考量 ...

将网页原文分页翻译大致上的实作，到上一篇就差不多了。但是在使用几天後发现一个问题，如果文章内容太长...

前言昨天我们使用了 fastAPI 内建 client 的 UI 来与 API 互动，今天我们改为...

前言昨天我们设计好UI介面後，我们有一堆按钮和文字框的"元件"，要让这些元...

TOGAF由国际标准权威组织The Open Group制定。The Open Group於1993...