用機器學習模型預測MVP得主 - NBA

By Blanche
at 2021-04-30T13:33
at 2021-04-30T13:33
Table of Contents
大略看了一下原文
提供我的一點淺見
首先
使用機器學習處理問題
是假設實際存在一個真實的模型
接著透過資料訓練出一個模型盡可能接近真實的模型
然後我們就可以拿訓練出來的模型對新的資料做預測
但是在這個問題上面
MVP票選並不是一個固定的模型
投票的人不一樣 投票的思維也不一樣
即便是同一批人 重新投一次票結果可能也不會一樣
因此
在這種問題上使用機器學習
甚至是各種資料科學的方法都可能存在不小的問題
資料的選取也很奇怪
作者的目的是建構一個預測MVP得主的模型
但實際上
他建構的是預測MVP得票排序的模型
作者為了讓訓練資料更多
把資料做了一個特別的調整
將原本的單一年度單一球員的資料(features)+是否為MVP(label)
調整成整個MVP票選結果排序中任意兩兩一組+誰的票多
具體詳細做法也沒有揭露
這樣的做法存在非常大的問題
因為同類型的球員會有分票效應
你不會知道把第一名的球員抽出之後
原本投給他的票會如何地分配給後面的球員
整個MVP票選結果 並沒有 告訴我們兩兩一組的票選結果
但是作者的模型大量使用了兩兩一組的排序關係作為訓練資料
然後最重要的是模型訓練方式跟模型評估
除了揭示使用了 XGBoost與LambdaMART 外
其他所有重要資訊都沒有揭露
我們無法得知所有的38年之中
哪些年份被拿來做為訓練資料
或是每個年份中哪些兩兩成對的組合是訓練資料
當然更不會知道訓練出來的模型評估結果好或壞
也不無可能作者把訓練資料跟測試資料反覆做各種分切
最後選取一種最滿意的切法做最後的建模
這樣做就會造成 data leakage 的問題
大概先這樣
---
如果有太複雜的ML問題
建議寄站內信給前站長 CharlieL
XD
--
提供我的一點淺見
首先
使用機器學習處理問題
是假設實際存在一個真實的模型
接著透過資料訓練出一個模型盡可能接近真實的模型
然後我們就可以拿訓練出來的模型對新的資料做預測
但是在這個問題上面
MVP票選並不是一個固定的模型
投票的人不一樣 投票的思維也不一樣
即便是同一批人 重新投一次票結果可能也不會一樣
因此
在這種問題上使用機器學習
甚至是各種資料科學的方法都可能存在不小的問題
資料的選取也很奇怪
作者的目的是建構一個預測MVP得主的模型
但實際上
他建構的是預測MVP得票排序的模型
作者為了讓訓練資料更多
把資料做了一個特別的調整
將原本的單一年度單一球員的資料(features)+是否為MVP(label)
調整成整個MVP票選結果排序中任意兩兩一組+誰的票多
具體詳細做法也沒有揭露
這樣的做法存在非常大的問題
因為同類型的球員會有分票效應
你不會知道把第一名的球員抽出之後
原本投給他的票會如何地分配給後面的球員
整個MVP票選結果 並沒有 告訴我們兩兩一組的票選結果
但是作者的模型大量使用了兩兩一組的排序關係作為訓練資料
然後最重要的是模型訓練方式跟模型評估
除了揭示使用了 XGBoost與LambdaMART 外
其他所有重要資訊都沒有揭露
我們無法得知所有的38年之中
哪些年份被拿來做為訓練資料
或是每個年份中哪些兩兩成對的組合是訓練資料
當然更不會知道訓練出來的模型評估結果好或壞
也不無可能作者把訓練資料跟測試資料反覆做各種分切
最後選取一種最滿意的切法做最後的建模
這樣做就會造成 data leakage 的問題
大概先這樣
---
如果有太複雜的ML問題
建議寄站內信給前站長 CharlieL
XD
--
Tags:
NBA
All Comments

By George
at 2021-05-02T23:46
at 2021-05-02T23:46

By Necoo
at 2021-05-03T09:20
at 2021-05-03T09:20

By Ethan
at 2021-05-05T11:28
at 2021-05-05T11:28

By Agatha
at 2021-05-08T22:39
at 2021-05-08T22:39

By Jack
at 2021-05-11T12:18
at 2021-05-11T12:18

By Sarah
at 2021-05-11T17:46
at 2021-05-11T17:46

By Bethany
at 2021-05-11T23:10
at 2021-05-11T23:10

By Olivia
at 2021-05-14T13:13
at 2021-05-14T13:13

By Emily
at 2021-05-16T22:36
at 2021-05-16T22:36

By Yedda
at 2021-05-18T18:57
at 2021-05-18T18:57

By Liam
at 2021-05-23T03:44
at 2021-05-23T03:44

By Donna
at 2021-05-27T21:52
at 2021-05-27T21:52

By Genevieve
at 2021-05-28T21:36
at 2021-05-28T21:36

By Kelly
at 2021-05-31T14:02
at 2021-05-31T14:02

By Madame
at 2021-06-03T18:40
at 2021-06-03T18:40

By Mia
at 2021-06-04T09:57
at 2021-06-04T09:57

By Tracy
at 2021-06-06T17:58
at 2021-06-06T17:58

By Franklin
at 2021-06-11T04:02
at 2021-06-11T04:02

By Carol
at 2021-06-11T11:38
at 2021-06-11T11:38

By Dora
at 2021-06-12T11:33
at 2021-06-12T11:33

By Margaret
at 2021-06-15T21:40
at 2021-06-15T21:40

By Franklin
at 2021-06-19T22:53
at 2021-06-19T22:53

By Rebecca
at 2021-06-24T10:26
at 2021-06-24T10:26

By Barb Cronin
at 2021-06-26T15:52
at 2021-06-26T15:52

By Puput
at 2021-06-28T20:42
at 2021-06-28T20:42

By Yedda
at 2021-06-29T02:06
at 2021-06-29T02:06

By Robert
at 2021-06-29T14:15
at 2021-06-29T14:15

By Sandy
at 2021-07-02T15:50
at 2021-07-02T15:50

By Quanna
at 2021-07-04T09:23
at 2021-07-04T09:23

By Cara
at 2021-07-06T22:05
at 2021-07-06T22:05

By Kristin
at 2021-07-10T00:58
at 2021-07-10T00:58

By Margaret
at 2021-07-14T17:33
at 2021-07-14T17:33

By Olga
at 2021-07-17T02:21
at 2021-07-17T02:21

By Emma
at 2021-07-18T01:33
at 2021-07-18T01:33

By Dora
at 2021-07-18T04:55
at 2021-07-18T04:55

By Faithe
at 2021-07-21T21:56
at 2021-07-21T21:56

By Sierra Rose
at 2021-07-22T01:35
at 2021-07-22T01:35

By Elma
at 2021-07-24T05:31
at 2021-07-24T05:31

By Noah
at 2021-07-26T23:37
at 2021-07-26T23:37

By Bennie
at 2021-07-29T08:41
at 2021-07-29T08:41

By Daph Bay
at 2021-08-03T05:30
at 2021-08-03T05:30

By Liam
at 2021-08-03T09:43
at 2021-08-03T09:43

By George
at 2021-08-07T13:50
at 2021-08-07T13:50

By Carol
at 2021-08-10T13:25
at 2021-08-10T13:25

By Blanche
at 2021-08-14T02:07
at 2021-08-14T02:07

By Sierra Rose
at 2021-08-15T04:06
at 2021-08-15T04:06

By Jacky
at 2021-08-17T19:14
at 2021-08-17T19:14

By Ivy
at 2021-08-20T17:32
at 2021-08-20T17:32

By Harry
at 2021-08-21T04:18
at 2021-08-21T04:18

By Tracy
at 2021-08-25T20:13
at 2021-08-25T20:13

By Rebecca
at 2021-08-27T01:48
at 2021-08-27T01:48

By Gilbert
at 2021-08-30T07:46
at 2021-08-30T07:46

By Queena
at 2021-09-02T15:24
at 2021-09-02T15:24

By Jessica
at 2021-09-05T00:59
at 2021-09-05T00:59

By Caitlin
at 2021-09-09T08:48
at 2021-09-09T08:48

By Sarah
at 2021-09-13T19:05
at 2021-09-13T19:05

By Puput
at 2021-09-14T11:59
at 2021-09-14T11:59

By Megan
at 2021-09-17T12:57
at 2021-09-17T12:57

By Yedda
at 2021-09-17T18:52
at 2021-09-17T18:52

By Poppy
at 2021-09-18T08:26
at 2021-09-18T08:26

By Todd Johnson
at 2021-09-21T19:08
at 2021-09-21T19:08

By Emily
at 2021-09-22T09:57
at 2021-09-22T09:57

By Charlotte
at 2021-09-24T13:13
at 2021-09-24T13:13

By Lucy
at 2021-09-27T05:35
at 2021-09-27T05:35

By Tom
at 2021-10-01T03:24
at 2021-10-01T03:24

By Wallis
at 2021-10-03T15:40
at 2021-10-03T15:40

By Edith
at 2021-10-06T06:50
at 2021-10-06T06:50

By Hamiltion
at 2021-10-10T21:25
at 2021-10-10T21:25

By Rachel
at 2021-10-14T09:16
at 2021-10-14T09:16

By Frederica
at 2021-10-14T22:15
at 2021-10-14T22:15

By Erin
at 2021-10-18T17:07
at 2021-10-18T17:07

By Edith
at 2021-10-20T17:41
at 2021-10-20T17:41
Related Posts
用機器學習模型預估MVP得主

By Iris
at 2021-04-30T13:18
at 2021-04-30T13:18
原來當初Nash的MVP算是偷的?

By Erin
at 2021-04-30T13:03
at 2021-04-30T13:03
原來當初Nash的MVP算是偷的?

By Charlotte
at 2021-04-30T12:46
at 2021-04-30T12:46
Nash:我只需要安排KD上場,然後好事就會發

By Una
at 2021-04-30T12:34
at 2021-04-30T12:34
原來當初Nash的MVP算是偷的?

By Liam
at 2021-04-30T12:31
at 2021-04-30T12:31