[Day 7] 从零开始的股票预测 - 异常值侦测

一、异常值(Outliers)

异常值是指某些大幅度偏离正常值的资料点,来源可能是测量异常或记录异常
由於该值容易导致模型偏离正常值的预测,因此滤除异常值通常是进行资料分析的第一步
https://ithelp.ithome.com.tw/upload/images/20210912/20141586M0DUbjs4rz.png
红点即为异常值 from [1]

二、高杠杆观察值(High Leverage Observations)

高杠杆观察值类似异常值,但通常对模型训练有极大的正面影响,也就是有高杠杆值(high leverage)
https://ithelp.ithome.com.tw/upload/images/20210912/20141586TwA3dekADK.png
红点虽远离正常值,但因其高杠杆值而不须被滤除 from [1]

三、股市资料的异常值

然而尴尬的是,股市由於波动起伏大,容易把高杠杆观察值辨识为异常值
除非是差距真的十分庞大(一天价格差距2倍之类的),
否则异常值侦测可以说没多大意义

四、实作

由上所述,所以程序码看看就好,
基本上我把程序写完才想到上述问题,
如果我之後问/想到另外解法再改文章

没错,我又挖坑了

参考


<<:  【Day02】永丰金融APIs-消费支付API

>>:  案例:AWS MLOps Framework - 解决方案介绍

Day22 - [丰收款] 以Django Web框架实作永丰API线上支付模拟情境(3) - 两种付款方式实作

昨天使用了Bootstrap5、Vue,打造了我们的付款流程入口页面後,今天要将之前的ATM虚拟帐户...

DAY7 - 图

之後会有几天与图相关的演算法,所以今天先看一下表示方式~~ 边 1135. 最低成本联通所有城市这题...

Sass/Css 设计模式(Smacss) DAY37

今天要来介绍 Sass/Css 设计模式啦~~ 首先我们先认识 最好入门的 Smacss 官网: h...

Day 20:AWS 是什麽?30天从动漫/影视作品看AWS服务应用 -《龙与雀斑公主》

大家好像纷纷完赛我还在这边混,不满三十篇真的要一语成谶了QQ 未来也许会转移到其他平台去继续写一些关...

Day15 - 【概念篇】OAuth flows: Authorization Code

本系列文之後也会置於个人网站 +----------+ | Resource | | Owner ...