简单说回归 | ML#Day14

wiki 说明页:回归分析

想了解详细的说明,请见wiki或者其他参考资料。

或者也可以直接看下面,自己对关於回归的简单概念说明。

回归分析的本身来自统计学,统计学又是来自数学的延伸,所以模型运算其实背後就是做一堆数学运算,这一点也不违和,反倒是非常自然。

到这里,其实我们也可以理解成作ML训练模型,就是利用程序的方式辅助做一堆数学运算,得到一个数学运算後的结果/函式。

既然是这样,那用手算人脑算可不可行?其实以简单的回归模型来说,还真的可以。

不过就像用计算机做加减乘除,和手算加减乘除一样,基本上用手算会非常辛苦。

做回归分析的话,最简单入门的做法就是一次方程序,例如说:

范例1

y = ax + b1

范例2

y = aX1 + bX2 + cX3 + dX4 ......

y = 我们想要的结果 = `应变数` = 受自变数影响而变化的值

x ,X1, X2, X3, X4 = 参数/特徵值 = `自变数`

a,b,c,d = `系数` = 每个参数的权重(影响力)

b1 = `截距` = 数值的起点 

截距,这个名词不用太陌生,譬如说一般成年男性可能从158公分开始往上加(借用服兵役的入伍标准),那资料范围大概就在158~200之类的,而不是从0开始,158就是基本值的概念。

假设在我们商品最低消费的单位是10元,那麽如果过去一个小时内我们有100张订单,我们也可以预期订单总金额至少在1000元以上对吧?

如果我们训练的回归模型,如了参数(自变数)可以自行决定以外,那些系数(权重)要怎麽给出一个数值呢?

所谓的训练,简单的可以理解,就是为了找出这些系数,更进阶的一点,可以说是为了确定这些参数是不适用,或者使用的函式本身(上面的例子就是一元方程序)能不能适用,亦或者需要换成别种方程序。


<<:  铁人赛 Day22 -- Bootstrap 格线系统

>>:  Day7 Let's ODOO: Model(4) ORM API

Day05 X Code Minimize & Uglify

从今天开始终於要正式进入介绍前端效能优化各种技巧的章节了,如果到今天还愿意继续坚持看下去的读者记得...

Day29 javascript RegExp介绍

今天要来看的是JavaScript RegExp 对象,因为刚好最近做表单要用到,因此就来顺便做点笔...

DAY 16 Big Data 5Vs – Variety(速度) Glue(4) Glue Studio

继续建立昨天的资料处理任务: 昨天建立的script可以从工具栏中job分页找到 档案本身会存在S3...

Day15:刀枪与弓箭

初学写程序的时候,常常会用到阵列(array)的概念,当我们想储存一堆有顺序性的值或变数时,就会把它...

Neo4j 的 GraphQL 计画:GRANDstack

上一篇文章开启了 GraphQL 的话题,介绍 Neo4j GraphQL plugin 的使用,让...