用機器學習模型預估MVP得主 - NBA

Iris · 2021-04-30

Table of Contents

Post
Comments
Related Posts

※ 引述《timmyen (Ako)》之銘言：
: 今天早上在reddit看到的文章，覺得挺有趣，轉過來跟版友們分享。
: 小弟不是學資料科學的，如果內文有誤也請不吝指正
: 原文：https://perthirtysix.com/essay/2021-nba-mvp-race
: 懶人包：
: 作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果（包含排名及票數）
: 建造了一個預估球員得到MVP的機率以及MVP得主的模型，
: 利用這個模型，在過去38年中可以正確的計算出32年的得主。
: 在這個模型中，各項球員數據的權重（也就是這個模型認為影響MVP票選最重要的數據)
: 依序如下：
: https://imgur.com/33ouqUG
: 球隊勝率%
: 每場上場時間
: 球隊種子序
: WS/48
: 每場得分
: 出賽場次
: VORP
: 2分命中率
: 罰球次數
: 助攻數
: 每場籃板
: 整體命中率
: BPM
: Usage%
: 每場失誤數
: 真實命中率
: (以下不列，可以自己看圖)
: 模型利用以上數據算出每一個球員的candidacy score
: 這個分數越高者，即是模型認為越有可能得到MVP的人選
: 要特別說的是，某些數據本身是互相有關聯性的(譬如：兩分/三分命中率及整體命中率，
: 或是整體命中率跟一大堆進階數據)，由於已經被重複計算過，因此單項的權重會降低，
: 不代表這項數據就不重要。
: ===
: 幾個有趣的結果
: 1. 誰是這38年來MVP分數最高的球員？
: 答案是08-09年的姆斯，分數高達4.49
: 2. 那最低分的MVP得主又是誰？
: 答案是04-05年的Nash，他當年的分數只有1.09
: 3. 誰的MVP被偷了？(誤)
: 剛剛提到38年中這個模型成功預測出32年的MVP得主，
: 這也代表其中有6年模型預測跟最終的結果是不一致的，
: (1) 2016-2017年的MVP，模型預測得主是Harden(2.73)，最終由當年拿下平均大三元
: 的Westbrook(2.44, 第二)拿走MVP
: (2) 2010-2011年，當年分數最高的是LBJ(2.37)，最終MVP被Rose(2.23)拿走。
: (3) 2004-2005年，也就是上面提到，Nash以史上最低分(1.09)拿下MVP的那年。
: 當年屈居第二的是Shaq (1.12，其實沒差很多)，也難怪他老人家到現在還在記仇
: 另外，隔年(05-06)Nash連莊時MVP分數也不是第一(1.8)，
: 當年分數第一的是LBJ(2.25)，只能說Nash真的是這個模型的outlier
: 4. Kobe到底有沒有偷了CP3一個MVP？
: 如果用這個模型看，答案是沒有，當年(07-08)Kobe以2.62分拿下MVP，
: 屈居第二的CP3分數是2.2分
: 5. 38年來最大的一二名差距發生在1999-2000年，當年大歐以3.71分拿下MVP，
: 分數第二的是Alonzo Mourning -- 0.7分 (票選第二的是KG，分數0.55)
: 另外，Curry全票MVP那年分數是3.47分，第二名的可愛1.89分，也是不小的差距
: 6. 那今年的MVP會是誰呢？
: 模型預測今年的MVP會是阿肥Jokic
: https://imgur.com/KRIWmS9
: 本賽季截至目前為止，MVP分數最高的三人分別是
: Jokic (2.02)
: 字母哥(0.26)
: Embiid(0.04)
: 非常巨大的差距
: ====
: 有興趣的版友可以去看看這個模型是怎麼建出來的
: 裡面有個"Explore 1984 - 2020"可以拉出這38年間所有模型跑出來的結果
: https://imgur.com/ZU04aVC
: Reddit討論：
: https://www.reddit.com/r/nba/comments/n150xj/

討論這問題先搞懂MVP是啥好嗎？
最有“價值”球員
球員的價值又不是那些數據能完整呈現的
況且這些數據基本都是人為定義

老衲第一年會拿主因就是回歸後作為核心戰績躍升
你說這不能表現一個球員的價值？

Rose那年更好笑了
LBJ身邊有兩個去年前五的隊友戰績還輸
你跟我說他比較有價值？

龜龜那年就是大三元噱頭
我也覺得用數據有沒有湊到雙位數評斷球員加值扯到不行
但就是投出來的結果

另外這model 32/38的準確度還是在偷看答案的情況下得到的
就說明用這些數據看MVP本來就非常浮動
有個model出來大家討論/預測是不錯啦
但拿這個結果出來氣噗噗誰偷誰就好笑了

-----
Sent from JPTT on my Google Pixel 4 XL.

--

NBA

All Comments

Daph Bay2021-05-03

有些東西本就不是量化可以看出來的數據都只是參考

Gilbert2021-05-07

這篇中肯

Liam2021-05-10

推

Thomas2021-05-11

數據是死的，投票的人是活的，要拿MVP本來就會有諸
多因素影響，這篇正解

Rachel2021-05-15

同感拿結果套出來的模型去argue哪年的結果不準也
是蠻奇怪的難道不是繼續修改模型嗎？

Daniel2021-05-20

拿結果去弄出來的模型結果38個sample就有6個是錯的
這種白癡模型也有人會信哦笑死

Ophelia2021-05-21

別那麼激動只是預測一下

Harry2021-05-22

所以姆斯去年該拿囉，沒有他一輪都沒有

Damian2021-05-25

氣成這樣 XD

Freda2021-05-26

但是總要有一個客觀的評價，大家在努力找啊

Margaret2021-05-27

人家是拿數字去解釋你拿感覺去解釋還氣成這樣是
怎樣

Isla2021-05-29

你真的有搞清楚那個模型是從什麼角度解釋MVP拉嗎
笑死

Barb Cronin2021-06-01

人家就是用模型跑又沒有說他就是標準

Irma2021-06-05

大家就在討論啊就你特別發一篇出來氣XD

Edward Lewis2021-06-06

說真的如果機器學習能得出跟人類投票完全符合的結果
，那在坐各位應該都不用工作了不過就是分享個實驗
結果，這麼認真辯護幹嘛

Faithe2021-06-08

你很氣欸數據分析本來就是這樣了啊連人為因素都能
分析的話ML就無敵了好嗎

Hazel2021-06-11

這兩天太陽迷真是火力十足XD

Brianna2021-06-14

模型就是推測跟參考而已而且他的準度也不低

Mia2021-06-18

照這套賭，勝率32/38；要是原PO能弄出勝率更高的mo
del，賭客當然樂觀其成啊

Elvira2021-06-22

100%命中就會被argue過適了啊 XD

Bethany2021-06-24

機器學習我只服濤哥

Kama2021-06-25

你是不是不懂數據分析

Jack2021-06-26

會很在乎，說是什麼偷啊、不如第二順位，大概就是
下重注的或是死忠粉絲啊！發洩一下無傷大雅，看球
本質就是娛樂嘛

William2021-06-27

笑死我從頭到尾沒有批評那model
一堆人中文不好在那跳針

Mary2021-07-01

無言

Enid2021-07-04

原po內文一堆矛盾==

Blanche2021-07-05

人家認為這些數據配合權重就是可以某種程度上代表M
VP。要拿「不可見的感覺」出來講講的就是另外一件
事情了。

Frederica2021-07-09

等等，那model難道不是拿那38年的MVP當作test data
嗎？train應該要用額外年度吧？

Elma2021-07-12

不要這麼中肯

Kama2021-07-15

好不容易有浮木飄過來

Kumar2021-07-18

跟不是工程的人討論數據分析本來就別奢望他們懂

Rachel2021-07-22

人家的模型在試圖算出可能被“選”出來的MVP 要是
有個單純只在量化球員個人表現價值的模型多好

Caitlin2021-07-26

其實32/38沒啥參考價值

Dinah2021-07-26

你是不是看不懂原PO想表達什麼..

Adele2021-07-30

真的 32/38 還說誰偷誰的根本自己做壞model還在吹

Selena2021-07-31

其實他不算32/38啊因為那個是已知的資料

Oscar2021-08-01

你用這組model用test之後還未知的數年mvp才知道準確
率

Rachel2021-08-03

其實妳也可以用出38/38但這個預測之後的mvp一定很爛

Todd Johnson2021-08-07

那強者跟強者同隊數據會稀釋怎不說只看戰績那為
何不綁定只能頒給戰績第一事實上就是戰績也只是數
據之一

Quanna2021-08-12

幫補血噓文的套路好一貫XD

Anthony2021-08-13

一看就是不懂機器學習的文組

George2021-08-14

至少人家有數據，你只會通靈

Lauren2021-08-17

supervised learning本來就要給training data好嗎

Agnes2021-08-18

還在十進位湊雙位數??? 到底醒了沒啊

Madame2021-08-20

幫我看一下我這樣有符合一貫套路嗎

Agnes2021-08-24

得分王 PER最高單核帶隊講幾次了還在人類十進位?

Puput2021-08-25

笑死

Joseph2021-08-30

我也是沒認真噓

Eartha2021-08-31

好了啦每年改標準最重要

Doris2021-09-02

都在湊答案了，應該有辦法全對，例如前後季戰績差
異大加分、或平均大三元加分之類的

Ursula2021-09-05

氣氣氣，嘻嘻

Ingrid2021-09-06

蠻想知道他是用那幾年的基礎資料當基底去回測過去過
去mvp的準確度

Kama2021-09-09

…

Ingrid2021-09-12

笑死

Susan2021-09-14

就是數據分析，那感覺跟人家吵啥，潑婦罵街喔？說看
看妳的分析方法看可以猜中多少個啊

用機器學習模型預估MVP得主 - NBA

All Comments

Related Posts