利用大数据分析预测MLB胜负(上)

本文将要介绍由Andrew Y. Cui撰写的《Forecasting Outcomes of Major League Baseball Games Using Machine Learning》,其主要是利用机器学习对MLB(美国职棒)进行赛事胜负预测,在最终结果上获得了61.77%的胜率,但究竟能不能实际运用在运彩当中呢?我们将在介绍完该篇期刊後,为各位实测看看结果!!

以预防读者一次受到太多资讯的冲击,而无法有效吸收,本介绍将分为上、中、下三篇,分别为:

资料的前处理与特徵值的筛选
模型的建构与选择
实测结果
资料的前处理与特徵值的筛选

1.模型预测基准

我们进行模型的预测通常需要一个基准机率,大多在做球类运动的研究者都会先以人们常说的「主队优势」做为参考,也就是球队在主场获胜的机率作为一个基准,本篇作者也做了一样的方式,作者利用2000年到2019年的数据计算每年的「主队获胜机率」究竟为多少,可以发现这19年来主队的胜率最高曾来到56%之多,但近几年的数据可以看到,「主队优势」的机率逐渐下降,约来到只剩下53%左右,但不论56%或是53%,这都将成为模型预测的基准,也就是至少要做出能够高於该胜率的模型,我们才能算是成功。

2.MLB队伍强弱会分明吗?

球队的强弱分明容易影响模型的预测,我们从下方作者做出从2000年到2019年各球队胜场数(每一个蓝点代表一个球队该年的胜场数)来看,球队的强弱分明在近几年有相对明显一点,这很可能跟整个MLB的生态有关,强者都容易聚集在强队上,这也表示我们在预测上或许能够容易一些,但如果运用在运彩上或许就不是那麽的乐观,这部份我们之後的篇章再作解释。

想看更详细的请到下面连结/images/emoticon/emoticon37.gif

原文出处:Guess365


<<:  <ROS笔记区>0.0 一堆 LIUNX的指令

>>:  如何在 PC 上将 YouTube影片下载爲MP4

Spring Framework X Kotlin Day 15 AOP

GitHub Repo https://github.com/b2etw/Spring-Kotlin...

谈谈 Log 的定义以及使用 - part1

Spring Boot 内部所有日志记录是使用 Commons Logging 实现,同时默认配置也...

Day-22 Spinner

本次要介绍的原件为Spinner, Spinner为下拉式选单, 其优点为节省空间, 本篇会先说明如...

Day 15 - 从Business Intelligence(BI)到AI

图片来源 很多时候讲多了数据分析, 会让人傻傻分不清楚到底是要用AI(人工智慧)还是BI(商业智慧...

Proof of Work 工作量证明

前言 在区块链中每条链或多或少都各自发展出自己不同的共识机制,例如 Proof of Work、Pr...