#22 数据中中的特徵相关性(1)

特徵列的研究主要应用於预测活动。举例来说,在金融分析中,透过两档股票价格波动的相关,来判断他们之间的关系,以期达到最大化收益的同时最小话风险的目的。

关於预测,机率论提供了一套完整的数学方法。
再来说一些随机变数的重要特徵。随机变数,一般是向量,可以包涵不同设定值范围的多个变数,我们的目的就是要研究这些变数的分布情况,也就是随机变数的数字特徵,从中发掘出一定的规律性。

  • 期望:衡量样本某个特徵列设定值范围平均值。
  • 方差:横量样本某个特徵列设定值范围的离散程度。
  • 协方差矩阵和相关系数:横量样本特徵列之间线性相关性。

相关系数(Correlation Coefficient)

  1. 相关系数定义:
    https://chart.googleapis.com/chart?cht=tx&chl=%5Crho_%7BXY%7D%3D%5Cfrac%7BCov(X%2CY)%7D%7B%5Csqrt%7BD(X)%7D%5Csqrt%7BD(Y)%7D%7D%3D%5Cfrac%7BE((X-EX)(Y-EY))%7D%7B%5Csqrt%7BD(X)%7D%5Csqrt%7BD(Y)%7D%7D

相关系数是衡量两个特徵列之间相关程度的一种方法,其设定值范围是[-1, 1]。相关系数的绝对值越大,表明特徵列X与Y的相关程度越高。当X与Y线性相关时,相关系数设定值为1(正线性相关)或-1(负线性相关)。


<<:  [Day 23] -『 GO语言学习笔记』- 复合型别 - 阵列(Array) (I)

>>:  [C 语言笔记--Day25] fork() 的小小练习

WordPress外挂总小小整理

详细可以参考这个网站页面的整理,下面是我协杠玩WordPress半年来的心得 https://109...

下载nodejs

学习nodejs的第一步..就是先去官网下载nodejs https://nodejs.org/en...

30天轻松学会unity自制游戏-新增死亡画面

通常游戏会有一个死亡画面,询问要重新开始,离开,增强能力(看广告)…等,先一样在画布上点右键给一个i...

学习成为人体 PE Parser

看日常分享: AwesomeCS FB 看技术文章: AwesomeCS Wiki 笔者最近在阅读...

全球付虚拟信用卡被盗刷余额

全球付Globalcash是虚拟信用卡,支持Visa/MasterCard。为了自己账户的安全,在境...