用機器學習模型預估MVP得主 - NBA

Iris avatar
By Iris
at 2021-04-30T13:18

Table of Contents

※ 引述《timmyen (Ako)》之銘言:
: 今天早上在reddit看到的文章,覺得挺有趣,轉過來跟版友們分享。
: 小弟不是學資料科學的,如果內文有誤也請不吝指正
: 原文:https://perthirtysix.com/essay/2021-nba-mvp-race
: 懶人包:
: 作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果(包含排名及票數)
: 建造了一個預估球員得到MVP的機率以及MVP得主的模型,
: 利用這個模型,在過去38年中可以正確的計算出32年的得主。
: 在這個模型中,各項球員數據的權重(也就是這個模型認為影響MVP票選最重要的數據)
: 依序如下:
: https://imgur.com/33ouqUG
: 球隊勝率%
: 每場上場時間
: 球隊種子序
: WS/48
: 每場得分
: 出賽場次
: VORP
: 2分命中率
: 罰球次數
: 助攻數
: 每場籃板
: 整體命中率
: BPM
: Usage%
: 每場失誤數
: 真實命中率
: (以下不列,可以自己看圖)
: 模型利用以上數據算出每一個球員的candidacy score
: 這個分數越高者,即是模型認為越有可能得到MVP的人選
: 要特別說的是,某些數據本身是互相有關聯性的(譬如:兩分/三分命中率及整體命中率,
: 或是整體命中率跟一大堆進階數據),由於已經被重複計算過,因此單項的權重會降低,
: 不代表這項數據就不重要。
: ===
: 幾個有趣的結果
: 1. 誰是這38年來MVP分數最高的球員?
: 答案是08-09年的姆斯,分數高達4.49
: 2. 那最低分的MVP得主又是誰?
: 答案是04-05年的Nash,他當年的分數只有1.09
: 3. 誰的MVP被偷了?(誤)
: 剛剛提到38年中這個模型成功預測出32年的MVP得主,
: 這也代表其中有6年模型預測跟最終的結果是不一致的,
: (1) 2016-2017年的MVP,模型預測得主是Harden(2.73),最終由當年拿下平均大三元
: 的Westbrook(2.44, 第二)拿走MVP
: (2) 2010-2011年,當年分數最高的是LBJ(2.37),最終MVP被Rose(2.23)拿走。
: (3) 2004-2005年,也就是上面提到,Nash以史上最低分(1.09)拿下MVP的那年。
: 當年屈居第二的是Shaq (1.12,其實沒差很多),也難怪他老人家到現在還在記仇
: 另外,隔年(05-06)Nash連莊時MVP分數也不是第一(1.8),
: 當年分數第一的是LBJ(2.25),只能說Nash真的是這個模型的outlier
: 4. Kobe到底有沒有偷了CP3一個MVP?
: 如果用這個模型看,答案是沒有,當年(07-08)Kobe以2.62分拿下MVP,
: 屈居第二的CP3分數是2.2分
: 5. 38年來最大的一二名差距發生在1999-2000年,當年大歐以3.71分拿下MVP,
: 分數第二的是Alonzo Mourning -- 0.7分 (票選第二的是KG,分數0.55)
: 另外,Curry全票MVP那年分數是3.47分,第二名的可愛1.89分,也是不小的差距
: 6. 那今年的MVP會是誰呢?
: 模型預測今年的MVP會是阿肥Jokic
: https://imgur.com/KRIWmS9
: 本賽季截至目前為止,MVP分數最高的三人分別是
: Jokic (2.02)
: 字母哥(0.26)
: Embiid(0.04)
: 非常巨大的差距
: ====
: 有興趣的版友可以去看看這個模型是怎麼建出來的
: 裡面有個"Explore 1984 - 2020"可以拉出這38年間所有模型跑出來的結果
: https://imgur.com/ZU04aVC
: Reddit討論:
: https://www.reddit.com/r/nba/comments/n150xj/

討論這問題先搞懂MVP是啥好嗎?
最有“價值”球員
球員的價值又不是那些數據能完整呈現的
況且這些數據基本都是人為定義

老衲第一年會拿主因就是回歸後作為核心戰績躍升
你說這不能表現一個球員的價值?

Rose那年更好笑了
LBJ身邊有兩個去年前五的隊友戰績還輸
你跟我說他比較有價值?

龜龜那年就是大三元噱頭
我也覺得用數據有沒有湊到雙位數評斷球員加值扯到不行
但就是投出來的結果

另外這model 32/38的準確度還是在偷看答案的情況下得到的
就說明用這些數據看MVP本來就非常浮動
有個model出來大家討論/預測是不錯啦
但拿這個結果出來氣噗噗誰偷誰就好笑了


-----
Sent from JPTT on my Google Pixel 4 XL.

--
Tags: NBA

All Comments

Daph Bay avatar
By Daph Bay
at 2021-05-03T12:59
有些東西本就不是量化可以看出來的 數據都只是參考
Gilbert avatar
By Gilbert
at 2021-05-07T15:49
這篇中肯
Liam avatar
By Liam
at 2021-05-10T13:29
Thomas avatar
By Thomas
at 2021-05-11T04:45
數據是死的,投票的人是活的,要拿MVP本來就會有諸
多因素影響,這篇正解
Rachel avatar
By Rachel
at 2021-05-15T12:20
同感 拿結果套出來的模型 去argue哪年的結果不準 也
是蠻奇怪的 難道不是繼續修改模型嗎?
Daniel avatar
By Daniel
at 2021-05-20T08:39
拿結果去弄出來的模型 結果38個sample就有6個是錯的
這種白癡模型也有人會信哦 笑死
Ophelia avatar
By Ophelia
at 2021-05-21T02:39
別那麼激動 只是預測一下
Harry avatar
By Harry
at 2021-05-22T08:18
所以姆斯去年該拿囉,沒有他一輪都沒有
Damian avatar
By Damian
at 2021-05-25T19:48
氣成這樣 XD
Freda avatar
By Freda
at 2021-05-26T06:42
但是總要有一個客觀的評價,大家在努力找啊
Margaret avatar
By Margaret
at 2021-05-27T20:36
人家是拿數字去解釋 你拿感覺去解釋 還氣成這樣是
怎樣
Isla avatar
By Isla
at 2021-05-29T01:37
你真的有搞清楚那個模型是從什麼角度解釋MVP拉嗎
笑死
Barb Cronin avatar
By Barb Cronin
at 2021-06-01T04:04
人家就是用模型跑又沒有說他就是標準
Irma avatar
By Irma
at 2021-06-05T16:37
大家就在討論啊 就你特別發一篇出來氣XD
Edward Lewis avatar
By Edward Lewis
at 2021-06-06T21:38
說真的如果機器學習能得出跟人類投票完全符合的結果
,那在坐各位應該都不用工作了 不過就是分享個實驗
結果,這麼認真辯護幹嘛
Faithe avatar
By Faithe
at 2021-06-08T02:43
你很氣欸 數據分析本來就是這樣了啊 連人為因素都能
分析的話ML就無敵了好嗎
Hazel avatar
By Hazel
at 2021-06-11T03:33
這兩天太陽迷真是火力十足XD
Brianna avatar
By Brianna
at 2021-06-14T09:41
模型就是推測跟參考而已 而且他的準度也不低
Mia avatar
By Mia
at 2021-06-18T02:05
照這套賭,勝率32/38;要是原PO能弄出勝率更高的mo
del,賭客當然樂觀其成啊
Elvira avatar
By Elvira
at 2021-06-22T20:23
100%命中就會被argue過適了啊 XD
Bethany avatar
By Bethany
at 2021-06-24T02:32
機器學習我只服濤哥
Kama avatar
By Kama
at 2021-06-25T05:56
你是不是不懂數據分析
Jack avatar
By Jack
at 2021-06-26T14:50
會很在乎,說是什麼偷啊、不如第二順位,大概就是
下重注的或是死忠粉絲啊!發洩一下無傷大雅,看球
本質就是娛樂嘛
William avatar
By William
at 2021-06-27T15:34
笑死我從頭到尾沒有批評那model
一堆人中文不好在那跳針
Mary avatar
By Mary
at 2021-07-01T19:51
無言
Enid avatar
By Enid
at 2021-07-04T08:07
原po內文一堆矛盾==
Blanche avatar
By Blanche
at 2021-07-05T13:19
人家認為這些數據配合權重就是可以某種程度上代表M
VP。要拿「不可見的感覺」出來講講的就是另外一件
事情了。
Frederica avatar
By Frederica
at 2021-07-09T13:11
等等,那model難道不是拿那38年的MVP當作test data
嗎?train應該要用額外年度吧?
Elma avatar
By Elma
at 2021-07-12T03:30
不要這麼中肯
Kama avatar
By Kama
at 2021-07-15T18:32
好不容易有浮木飄過來
Kumar avatar
By Kumar
at 2021-07-18T14:02
跟不是工程的人討論數據分析本來就別奢望他們懂
Rachel avatar
By Rachel
at 2021-07-22T11:23
人家的模型在試圖算出可能被“選”出來的MVP 要是
有個單純只在量化球員個人表現價值的模型多好
Caitlin avatar
By Caitlin
at 2021-07-26T15:07
其實32/38沒啥參考價值
Dinah avatar
By Dinah
at 2021-07-26T20:15
你是不是看不懂原PO想表達什麼..
Adele avatar
By Adele
at 2021-07-30T23:09
真的 32/38 還說誰偷誰的 根本自己做壞model還在吹
Selena avatar
By Selena
at 2021-07-31T16:30
其實他不算32/38啊 因為那個是已知的資料
Oscar avatar
By Oscar
at 2021-08-01T07:34
你用這組model用test之後還未知的數年mvp才知道準確
Rachel avatar
By Rachel
at 2021-08-03T23:20
其實妳也可以用出38/38但這個預測之後的mvp一定很爛
Todd Johnson avatar
By Todd Johnson
at 2021-08-07T07:04
那強者跟強者同隊數據會稀釋怎不說 只看戰績 那為
何不綁定只能頒給戰績第一 事實上就是戰績也只是數
據之一
Quanna avatar
By Quanna
at 2021-08-12T03:03
幫補血 噓文的套路好一貫XD
Anthony avatar
By Anthony
at 2021-08-13T11:15
一看就是不懂機器學習的文組
George avatar
By George
at 2021-08-14T03:13
至少人家有數據,你只會通靈
Lauren avatar
By Lauren
at 2021-08-17T04:26
supervised learning本來就要給training data好嗎
Agnes avatar
By Agnes
at 2021-08-18T14:08
還在十進位湊雙位數??? 到底醒了沒啊
Madame avatar
By Madame
at 2021-08-20T04:46
幫我看一下我這樣有符合一貫套路嗎
Agnes avatar
By Agnes
at 2021-08-24T09:03
得分王 PER最高 單核帶隊 講幾次了還在人類十進位?
Puput avatar
By Puput
at 2021-08-25T23:44
笑死
Joseph avatar
By Joseph
at 2021-08-30T10:38
我也是沒認真噓
Eartha avatar
By Eartha
at 2021-08-31T03:27
好了啦每年改標準最重要
Doris avatar
By Doris
at 2021-09-02T09:06
都在湊答案了,應該有辦法全對,例如前後季戰績差
異大加分、或平均大三元加分 之類的
Ursula avatar
By Ursula
at 2021-09-05T16:14
氣氣氣,嘻嘻
Ingrid avatar
By Ingrid
at 2021-09-06T15:54
蠻想知道他是用那幾年的基礎資料當基底去回測過去過
去mvp的準確度
Kama avatar
By Kama
at 2021-09-09T04:12
Ingrid avatar
By Ingrid
at 2021-09-12T06:16
笑死
Susan avatar
By Susan
at 2021-09-14T16:44
就是數據分析,那感覺跟人家吵啥,潑婦罵街喔?說看
看妳的分析方法看可以猜中多少個啊

原來當初Nash的MVP算是偷的?

Erin avatar
By Erin
at 2021-04-30T13:03
※ 引述《sk050607 (板橋Vettel)》之銘言: : #1WYs3Uo8 (NBA) : 前面幾篇的一個程式文 : 回推了過往MVP候選人的數據 : 發現原來Nash的兩個MVP : 按照程式的計算 : 幾乎是幾十年來,所有MVP得主的最低標 : 這程式模擬中,這兩年Nash的模擬分數 : 甚至還不 ...

原來當初Nash的MVP算是偷的?

Charlotte avatar
By Charlotte
at 2021-04-30T12:46
程式代表一切那就不用印象分帶隊分了 先護航我岳父 熱火沒shaq ,wade單核帶隊可能性有沒有? 有,那記者票就投給Nash 再來,要說這座算偷 岳父粉我可以接受畢竟分差那麼近 不要像昨天CP粉在那狗鼻偷MVP 然後貼一個分差一兩百分的說偷 我承認CP很強,你可以護航說生錯時代 剛好撞到生 ...

原來當初Nash的MVP算是偷的?

Liam avatar
By Liam
at 2021-04-30T12:31
#1WYs3Uo8 (NBA) 前面幾篇的一個程式文 回推了過往MVP候選人的數據 發現原來Nash的兩個MVP 按照程式的計算 幾乎是幾十年來,所有MVP得主的最低標 這程式模擬中,這兩年Nash的模擬分數 甚至還不是排名第一 第一個MVP分數不及Shaq 第二個MVP分數不及Lebro ...

西區第十只能是勇士吧

Isabella avatar
By Isabella
at 2021-04-30T12:28
Jokic乾淨的打手 Campazzo的進攻犯規 都讓進逼附加賽的鵜鶘士氣大傷 聯盟驕子Curry本季都繳出MVP等級的表現了 勇士的戰績怎麼可以不進附加賽 鵜鶘完全不能威脅勇士的西10對吧 - ...

威廉森關鍵出手遭擋 裁判報告證實約柯奇

Belly avatar
By Belly
at 2021-04-30T11:03
威廉森關鍵出手遭擋 裁判報告證實約柯奇犯規 陳元廷/綜合外電報導 昨天(29號)的鵜鶘金塊之戰最終迎來意外結局,總在禁區逞兇的體能怪獸威廉森(Zion W illiamson)關鍵出手,竟遭不以防守見長的約柯奇(Nikola Jokic)一把擋下,如今裁判 報告審視回放畫面也證實約柯奇確實對威廉森犯規。 ...