利用大数据分析预测MLB胜负(下)

在上一篇文章中,我们介绍了作者最终挑选模了Elastic net (L1+L2) penalty regularization(弹性网路正规化)作为最後的预测模型,那麽我们现在有了特徵值跟预测模型这麽明确的目标,那麽我们一定要来实测看看究竟运用在运彩上是不是能够得到优异的结果呢?

数据前处理

1.资料抓取与整理

首先我们必须要先处理好所需的数据,我们先去爬取与计算需要的特徵值,我们的数据期间是以2015年赛季到2021年赛季共7年的比赛,并按照作者筛选掉先发投手平均首发低於12场的比赛

2.特徵重要性

我们也进行了特徵重要性的观察,发现的确就算我们抓取到最新2021年的数据,「上垒率」仍然是影响比赛胜负中最重要的因子

3.模型准确度

我们以2015年到2020年6年的期间作为模型训练,而2021年整赛季的数据则做为我们模型最终要实战的数据,但我们实测的结果在2021年模型的准确度其实只有57.24%,是低於期刊中所显示的61.77%,这也有可能跟我们训练的期间长短或是最终验证的期间差异有关,因为作者是以2016年到2019年4年的数据做出61.77%,可能刚好在2021年的表现只能获得57.24%,但不论57.24%或是61.77%,我们都必须要能实际运用在运彩投注上才行

没看过中上篇的人可以去看看唷!!

利用大数据分析预测MLB胜负(上)

利用大数据分析预测MLB胜负(中)

想要阅读完整内容可以浏览原文/images/emoticon/emoticon08.gif
原文出处 : Guess365


<<:  利用大数据分析预测MLB胜负(中)

>>:  虾皮串接实作笔记-Create App 建立串接帐号

任务开发检讨

我理想的情况是, 事前planing好API(req、res),完成每只api估时,妥善把开发过程分...

专业必备技能:应用程序相关

专业必备技能:应用程序相关 https://wolkesau.medium.com/专业必备技能-应...

Re: 新手让网页 act 起来: Day16 - 探索 useState (2)

昨天我们成功的完成一个超简略版的 myUseState ,今天就让我们再来把它写完整一点吧! let...

javascript 防疫自学日记 day 1

自学coding长跑开始! 我要每天花两个小时自学~~~ 先整理学习资源—— 分成四part:(会一...

知名云服务供应商 Liquid Web 收购 WordPress 群众募资外挂 GiveWP

说起群众募资,有时是开始新产品、新服务或各种古怪的新奇事物。但也有典型的例如线上课程、解决某一件社...