NBA大数据预测高达65%准确且能赚钱的分析研究,究竟是真是假呢?

今天来分享一篇研究,是由Matthew Houde所撰写的《Predicting the Outcome of NBA Games》,是一篇利用机器学习的模型去预测NBA比赛结果的研究,而我们将这篇研究方法实测於2022年,也就是本赛季的常规赛中,回测结果竟然真的可以「赚钱」,所以就让我们来好好介绍这篇吧!!


博彩公司的阴谋

首先,我们以掷硬币来说明一下博彩公司背後的阴谋,假设你和朋友每人投注 10 元,如果掷出人头,你可赚到 10 元。如果掷出数字,你就输掉 10 元,这样规定下,你们双方都不占任何便宜,用博彩术语来说,这叫 100% 市场,也就是说投注的一方和受注的一方都没有任何优势(利润),因此,100% 市场就是零利润的市场。

但如果您是跟寻求利益的博彩公司赌铜板,那结果就不一样了,此时市场的百分比会超过 100%,而这超出 100% 的市场百分比即是博彩公司加诸在投注者身上的利润,或是博彩公司为服务收取的费用。

那要如何计算博彩公司每场比赛的利润呢?其公式如下

假设A队赔率为1.76,B队为2.1,那麽博彩公司的利润为(1/1.76)*100% +(1/2.1)*100%-100% = 4.4%。

而业界目前在各赛事中平均的利润都高达5%~8%,因此,我们如果将「赔率」加入到我们模型的预测上,虽然预测准确度能够有效的提升,但也容易使我们的预测越靠近博彩公司,那麽我们与博彩公司之间的利润差距就会有5%~8%的空间,也因此使我们相对较不易於获利的原因之一。


Matthew Houde的研究

Matthew Houde的研究则是利用了30个特徵值进行机器学习模型预测,而其30个特徵都未使用到任何赔率,并做出高达65.1%准确度的模型,也因此使我们对其感到兴趣。

Matthew Houde所利用的特徵值分别为以下主队与客队各15个特徵,而计算周期为本赛季前10场比赛的平均值

      并利用六个机器学习的模型进行预测,最终以Gaussian Naïve Bayes模型做出高达65.1%的准确度

实测结果

当我们知道该研究所使用的模型、特徵值等方法後,秉持着数据分析的原则,就必须要实测看看结果究竟如何。因此我们利用了NBA於2022年,也就是本赛季的常规赛做为绩效回测的实证,最终回测上的确获得了「65%」的准确度

在绩效的回测上,我们以每次下注1000元,并且只投注於不让分盘的结果,最终整年的获利来到了「21920元」,而曾经最高获利来到「26220元」,最低则有到「-19660元」,爆冷门(获利扣除成本>2000元)的比赛就有11笔,而霍获利介於1000到2000之间的比赛则有78笔,因此算是抓到相当多冷门的比赛

总结

从本次研究我们得知以下三个论点:

1.博弈公司开出的赔率虽然是预测比赛胜负中重要的特徵值,能有效提升预测准确度,但对於投注者来说获利不易

2.在特徵值未加入赔率下,相对容易预测中冷门的比赛,也因此较容易有较多单笔大的获利能用於弥补多笔亏损

3.本研究所参考的周期为本赛季前10场比赛,使得赛季初因参考数据较少,较容易失准,因此可以多尝试不同周期的数据来优化模型的预测


<<:  预测运动胜负大法,利用资料累积搭配机器学习探索《财富密码》

>>:  【VidPaw 替代品】 Windows/Mac 轻松下载在线影片

如何下载痞客邦的图片

今天要教大家如何简易的下载痞客邦的图片 一般来说,痞客邦的图片是不能直接右键另存的 所以其实只要把整...

TailwindCSS 从零开始 - 价目表卡片实战 - 基础卡片样式

上一篇完成了基础设置,这次就来建立一个基础卡片。 设定基础卡片样式外观 标题部分因为了整个内容更完...

[Day27]Vito'sfamily

上一篇介绍了Jolly Jumpers,这题讲了判断是不是Jolly Jumpers,也就是输入一个...

Day 03 - 命名的规则

如果有错误,欢迎留言指教~ Q_Q 好的命名,也能够清楚的让人一看就知道是在做什麽 团队有统一的写...

Day 28:面试

前言 这个环节的准备很特别,大部分时间都想着与考官的应答,这也是问题最开放、最及时所以也最难准备的环...