相关是什麽?来认识回归分析

当我们的自变数和应变数都是定量资料的时候,我们就可以用回归分析的方法来从中找出两者之间的关系。简单的来说,我们可以根据一个变量去预测另一个变量,而他们彼此之间的关系被称为相关性。

统计学透过回归分析,可以找出或是验证出一些较不直觉的变数关系,而这也是回归分析的强大之处!今天就让我们来搞懂什麽是回归分析吧~

怎麽找出变量之间的相关性?

首先,我们先把资料画成散布图的形式来观察,将变数X标示於一维座标图的横座标,变数Y标示於纵座标。

假如X增加Y也会增加,X减少Y也会减少,我们就会称呼两者之间有「正相关」;反之X增加Y减少,X减少Y增加,则为「负相关」;而X增加Y也不会增加会减少,X增加或减少也不会影响到Y的话,就是「不相关」。

在散布在座标上图中的点我们可以画出一条回归线,Y=aX+b。其中a为斜率,也就是所谓的回归系数,回归系数直观的告诉我们回归线的斜率陡峭程度,越陡峭表示其中一个变量只要改变一点点另一个变量就会有大幅度的改变。

相关系数

我们要如何判断回归线的好坏呢?这时候我们就需要用到相关系数来衡量两变量之间的方向与紧密程,当两个变量同时变化得越紧密,我们就可以说他们两个之间的相关性越强。

而判定它们的相关系数介於-1~1之间,需要注意的是r=0并不一定表示Y与X间没有关系,仅表示Y与X间无线性关系。

同样的,回归分析一样适用於假设检定!

使用回归分析要注意的事

在做回归分析上的解释时,需要注意两件事:

  • 小心虚假相关:两个独立的变数本来不具统计显着意义,但因为随机趋势存在,两个变数却会测出异常的相关性
  • 相关并不等於因果:两变数有相关性,但无法同时证明其因果关系

那我们要如何去检测两变数的因果关系呢?

这个就要使用到「随机对照实验」的方法,也就是业界俗称的「AB testing」!

这个方法无论是在数据分析的领域上,或是产品经理、行销人员,大多数想要验证商业上的构想时,都会广泛和频繁的用到~因此,让我们用统计学的角度来重新检视所谓的AB testing吧!我们明天见~

参考资料:

http://www1.pu.edu.tw/~hdchen/handout_bank/stat/94_4_stat_handout_08.pdf

https://sites.google.com/site/chiashulab/lecture_materials11

https://medium.com/r-语言自学系列/r语言自学日记-13-处理趋势问题-8eba9bd3df0d


<<:  非专业常见面试问题

>>:  Day 24 : 负责任的 AI - Responsible AI (RAI)

Day 2:可商用授权的开源专案

JUCE 专案原始码开放,除了少部分模组外,「几乎」所有模组的程序码皆可公开取得。JUCE 除了提供...

[EXCEL]危险的SUMIFS函数

前言 SUMIFS函数从EXCEL 2010开始出现之後,我很庆幸可以少写一些阵列公式。 这个函数可...

ASP.NET MVC 从入门到放弃(Day24)-MVC删除资料介绍

接下来讲讲删除 部分... 在查询的View那边可以看到下方程序码 @Html.ActionLink...

占位符文字太多超过显示范围

缘由: 今天一样讲画面布局的部分,开发时常常会使用到让使用者填入资料的textfield,但常常为了...

NestJs 延伸篇 - Federation 实作

上一篇我们建立了 gateway ,也把 Task Service 安装了 federation 的...