用機器學習模型預測MVP得主 - NBA
By Blanche
at 2021-04-30T13:33
at 2021-04-30T13:33
Table of Contents
大略看了一下原文
提供我的一點淺見
首先
使用機器學習處理問題
是假設實際存在一個真實的模型
接著透過資料訓練出一個模型盡可能接近真實的模型
然後我們就可以拿訓練出來的模型對新的資料做預測
但是在這個問題上面
MVP票選並不是一個固定的模型
投票的人不一樣 投票的思維也不一樣
即便是同一批人 重新投一次票結果可能也不會一樣
因此
在這種問題上使用機器學習
甚至是各種資料科學的方法都可能存在不小的問題
資料的選取也很奇怪
作者的目的是建構一個預測MVP得主的模型
但實際上
他建構的是預測MVP得票排序的模型
作者為了讓訓練資料更多
把資料做了一個特別的調整
將原本的單一年度單一球員的資料(features)+是否為MVP(label)
調整成整個MVP票選結果排序中任意兩兩一組+誰的票多
具體詳細做法也沒有揭露
這樣的做法存在非常大的問題
因為同類型的球員會有分票效應
你不會知道把第一名的球員抽出之後
原本投給他的票會如何地分配給後面的球員
整個MVP票選結果 並沒有 告訴我們兩兩一組的票選結果
但是作者的模型大量使用了兩兩一組的排序關係作為訓練資料
然後最重要的是模型訓練方式跟模型評估
除了揭示使用了 XGBoost與LambdaMART 外
其他所有重要資訊都沒有揭露
我們無法得知所有的38年之中
哪些年份被拿來做為訓練資料
或是每個年份中哪些兩兩成對的組合是訓練資料
當然更不會知道訓練出來的模型評估結果好或壞
也不無可能作者把訓練資料跟測試資料反覆做各種分切
最後選取一種最滿意的切法做最後的建模
這樣做就會造成 data leakage 的問題
大概先這樣
---
如果有太複雜的ML問題
建議寄站內信給前站長 CharlieL
XD
--
提供我的一點淺見
首先
使用機器學習處理問題
是假設實際存在一個真實的模型
接著透過資料訓練出一個模型盡可能接近真實的模型
然後我們就可以拿訓練出來的模型對新的資料做預測
但是在這個問題上面
MVP票選並不是一個固定的模型
投票的人不一樣 投票的思維也不一樣
即便是同一批人 重新投一次票結果可能也不會一樣
因此
在這種問題上使用機器學習
甚至是各種資料科學的方法都可能存在不小的問題
資料的選取也很奇怪
作者的目的是建構一個預測MVP得主的模型
但實際上
他建構的是預測MVP得票排序的模型
作者為了讓訓練資料更多
把資料做了一個特別的調整
將原本的單一年度單一球員的資料(features)+是否為MVP(label)
調整成整個MVP票選結果排序中任意兩兩一組+誰的票多
具體詳細做法也沒有揭露
這樣的做法存在非常大的問題
因為同類型的球員會有分票效應
你不會知道把第一名的球員抽出之後
原本投給他的票會如何地分配給後面的球員
整個MVP票選結果 並沒有 告訴我們兩兩一組的票選結果
但是作者的模型大量使用了兩兩一組的排序關係作為訓練資料
然後最重要的是模型訓練方式跟模型評估
除了揭示使用了 XGBoost與LambdaMART 外
其他所有重要資訊都沒有揭露
我們無法得知所有的38年之中
哪些年份被拿來做為訓練資料
或是每個年份中哪些兩兩成對的組合是訓練資料
當然更不會知道訓練出來的模型評估結果好或壞
也不無可能作者把訓練資料跟測試資料反覆做各種分切
最後選取一種最滿意的切法做最後的建模
這樣做就會造成 data leakage 的問題
大概先這樣
---
如果有太複雜的ML問題
建議寄站內信給前站長 CharlieL
XD
--
Tags:
NBA
All Comments
By George
at 2021-05-02T23:46
at 2021-05-02T23:46
By Necoo
at 2021-05-03T09:20
at 2021-05-03T09:20
By Ethan
at 2021-05-05T11:28
at 2021-05-05T11:28
By Agatha
at 2021-05-08T22:39
at 2021-05-08T22:39
By Jack
at 2021-05-11T12:18
at 2021-05-11T12:18
By Sarah
at 2021-05-11T17:46
at 2021-05-11T17:46
By Bethany
at 2021-05-11T23:10
at 2021-05-11T23:10
By Olivia
at 2021-05-14T13:13
at 2021-05-14T13:13
By Emily
at 2021-05-16T22:36
at 2021-05-16T22:36
By Yedda
at 2021-05-18T18:57
at 2021-05-18T18:57
By Liam
at 2021-05-23T03:44
at 2021-05-23T03:44
By Donna
at 2021-05-27T21:52
at 2021-05-27T21:52
By Genevieve
at 2021-05-28T21:36
at 2021-05-28T21:36
By Kelly
at 2021-05-31T14:02
at 2021-05-31T14:02
By Madame
at 2021-06-03T18:40
at 2021-06-03T18:40
By Mia
at 2021-06-04T09:57
at 2021-06-04T09:57
By Tracy
at 2021-06-06T17:58
at 2021-06-06T17:58
By Franklin
at 2021-06-11T04:02
at 2021-06-11T04:02
By Carol
at 2021-06-11T11:38
at 2021-06-11T11:38
By Dora
at 2021-06-12T11:33
at 2021-06-12T11:33
By Margaret
at 2021-06-15T21:40
at 2021-06-15T21:40
By Franklin
at 2021-06-19T22:53
at 2021-06-19T22:53
By Rebecca
at 2021-06-24T10:26
at 2021-06-24T10:26
By Barb Cronin
at 2021-06-26T15:52
at 2021-06-26T15:52
By Puput
at 2021-06-28T20:42
at 2021-06-28T20:42
By Yedda
at 2021-06-29T02:06
at 2021-06-29T02:06
By Robert
at 2021-06-29T14:15
at 2021-06-29T14:15
By Sandy
at 2021-07-02T15:50
at 2021-07-02T15:50
By Quanna
at 2021-07-04T09:23
at 2021-07-04T09:23
By Cara
at 2021-07-06T22:05
at 2021-07-06T22:05
By Kristin
at 2021-07-10T00:58
at 2021-07-10T00:58
By Margaret
at 2021-07-14T17:33
at 2021-07-14T17:33
By Olga
at 2021-07-17T02:21
at 2021-07-17T02:21
By Emma
at 2021-07-18T01:33
at 2021-07-18T01:33
By Dora
at 2021-07-18T04:55
at 2021-07-18T04:55
By Faithe
at 2021-07-21T21:56
at 2021-07-21T21:56
By Sierra Rose
at 2021-07-22T01:35
at 2021-07-22T01:35
By Elma
at 2021-07-24T05:31
at 2021-07-24T05:31
By Noah
at 2021-07-26T23:37
at 2021-07-26T23:37
By Bennie
at 2021-07-29T08:41
at 2021-07-29T08:41
By Daph Bay
at 2021-08-03T05:30
at 2021-08-03T05:30
By Liam
at 2021-08-03T09:43
at 2021-08-03T09:43
By George
at 2021-08-07T13:50
at 2021-08-07T13:50
By Carol
at 2021-08-10T13:25
at 2021-08-10T13:25
By Blanche
at 2021-08-14T02:07
at 2021-08-14T02:07
By Sierra Rose
at 2021-08-15T04:06
at 2021-08-15T04:06
By Jacky
at 2021-08-17T19:14
at 2021-08-17T19:14
By Ivy
at 2021-08-20T17:32
at 2021-08-20T17:32
By Harry
at 2021-08-21T04:18
at 2021-08-21T04:18
By Tracy
at 2021-08-25T20:13
at 2021-08-25T20:13
By Rebecca
at 2021-08-27T01:48
at 2021-08-27T01:48
By Gilbert
at 2021-08-30T07:46
at 2021-08-30T07:46
By Queena
at 2021-09-02T15:24
at 2021-09-02T15:24
By Jessica
at 2021-09-05T00:59
at 2021-09-05T00:59
By Caitlin
at 2021-09-09T08:48
at 2021-09-09T08:48
By Sarah
at 2021-09-13T19:05
at 2021-09-13T19:05
By Puput
at 2021-09-14T11:59
at 2021-09-14T11:59
By Megan
at 2021-09-17T12:57
at 2021-09-17T12:57
By Yedda
at 2021-09-17T18:52
at 2021-09-17T18:52
By Poppy
at 2021-09-18T08:26
at 2021-09-18T08:26
By Todd Johnson
at 2021-09-21T19:08
at 2021-09-21T19:08
By Emily
at 2021-09-22T09:57
at 2021-09-22T09:57
By Charlotte
at 2021-09-24T13:13
at 2021-09-24T13:13
By Lucy
at 2021-09-27T05:35
at 2021-09-27T05:35
By Tom
at 2021-10-01T03:24
at 2021-10-01T03:24
By Wallis
at 2021-10-03T15:40
at 2021-10-03T15:40
By Edith
at 2021-10-06T06:50
at 2021-10-06T06:50
By Hamiltion
at 2021-10-10T21:25
at 2021-10-10T21:25
By Rachel
at 2021-10-14T09:16
at 2021-10-14T09:16
By Frederica
at 2021-10-14T22:15
at 2021-10-14T22:15
By Erin
at 2021-10-18T17:07
at 2021-10-18T17:07
By Edith
at 2021-10-20T17:41
at 2021-10-20T17:41
Related Posts
用機器學習模型預估MVP得主
By Iris
at 2021-04-30T13:18
at 2021-04-30T13:18
原來當初Nash的MVP算是偷的?
By Erin
at 2021-04-30T13:03
at 2021-04-30T13:03
原來當初Nash的MVP算是偷的?
By Charlotte
at 2021-04-30T12:46
at 2021-04-30T12:46
Nash:我只需要安排KD上場,然後好事就會發
By Una
at 2021-04-30T12:34
at 2021-04-30T12:34
原來當初Nash的MVP算是偷的?
By Liam
at 2021-04-30T12:31
at 2021-04-30T12:31