嘗試以機器學習排出P+前三隊 - 籃球

Charlie avatar
By Charlie
at 2022-07-08T10:44

Table of Contents

感謝大大有趣的文~
剛看了下UCLA論文後有幾個機器學習的問題想問,因文長用回文形式,若不適合本版我再刪


1. 關於features數目,原論文似乎自己挑18個數據,把一些數據如總籃板數、失誤(他們?
得失誤比較無法顯示好壞表現)等拿掉

而原po似乎是遠多於18再用2次降維方式後再K-Mean

不過論文看起來他們只是拿降維後的做2D visual而已 (下圖)

https://i.imgur.com/XbFWIRD.jpg

拿去K-Mean的是沒降維的,畢竟只有18維。這邊或許可以自己挑出類似features,才不會太
雜亂數據影響。

以下是他們選的

https://i.imgur.com/pYlMp8f.jpg

2. 論文最後是有說到其實「每個群是類似的」

如下圖, 每個群跟隊伍排名的線性關係p-value都很大(p-value 越大信心程度很小)

https://i.imgur.com/nx3TZqw.jpg

“This suggests that there is no relationship between how good a team is and mem
bership in a particular cluster. “

就是幾乎沒關係的意思

文中提到重點是「離每個分群質心的距離」才能顯現好壞球員,例如在x群中的離x群的中心
越遠,則球員越猛

https://i.imgur.com/FZ7CUxK.jpg

可看到p-value才0.02左右(0.98的信心)

簡言之,如果直接拿每個群當成一二三隊似乎不適合,可能用與跟質心的距離排出各個球員
才比較好。

而原PO現在分群中的第一隊,可能有些人是比較靠近質心,有些人則是遠離質心,比較好的
式可以多列出他們與質心的距離,越大則是越厲害

不過上述都是建立在你是follow這論文的作法,如果你有修改的話可能就不是我上述所說的
一樣了。

話說我也可能有錯,只是小弟的一些看法,歡迎指正。

發此文的用意只在推崇科學與運動的結合,很感動台籃版越來越活絡,也感謝原PO的effort

----
Sent from BePTT on my iPhone 7

--
Tags: 籃球

All Comments

Dorothy avatar
By Dorothy
at 2022-07-04T10:30
推推
Barb Cronin avatar
By Barb Cronin
at 2022-07-08T19:39
推,大力推!
Thomas avatar
By Thomas
at 2022-07-04T10:30
Olive avatar
By Olive
at 2022-07-08T19:39
推這篇
Andrew avatar
By Andrew
at 2022-07-04T10:30
i7 原po手機好能撐
Yedda avatar
By Yedda
at 2022-07-08T19:39
最近才從6s剛換成7 二手而已,小弟常摔手機,摔到
才不會心痛XD
Doris avatar
By Doris
at 2022-07-04T10:30
所以這篇是用分群去界定一二三隊的範圍,然後根據
分群去找跟勝場有最高度相關的球員?
Sarah avatar
By Sarah
at 2022-07-08T19:39
Eartha avatar
By Eartha
at 2022-07-04T10:30
推整理,很清楚!
Margaret avatar
By Margaret
at 2022-07-08T19:39
好文
Jake avatar
By Jake
at 2022-07-04T10:30
很好 有文獻探討 也有引用
Mary avatar
By Mary
at 2022-07-08T19:39
有點意思
Rae avatar
By Rae
at 2022-07-04T10:30
看來台籃板也是一堆ML的高手
Elvira avatar
By Elvira
at 2022-07-08T19:39
每個群裡的球員代表場上表現類似 但越遠離群中心
的球員(離群)代表有較群裡他人不一樣的表現
Victoria avatar
By Victoria
at 2022-07-04T10:30
好像有些字被吃掉了?像第一點:覺得
Caroline avatar
By Caroline
at 2022-07-08T19:39
感謝原po用心幫我找問題所在!關於第一點我去年也是
只有使用傳統數據,跑出來結果合理但又覺得沒什麼代
表性,今年才野心比較大想增加features,結果還無法
掌握好xD第二點我還真的忘記去試了,雖然我有修改做
法,但或許與質心距離也會是我系統中的key point,
我會再想想怎麼實現和應用,最後再感謝原po一次!!
Andy avatar
By Andy
at 2022-07-04T10:30
原來你去年就試過!真用心!
原論文也說可以放多一點features,多一點應該是很
有用,例如效率值、正負、Game Score等進階數據,
但全放可能太多就是
話說你有把結果放GitHub嗎?如果有前處理好的或許
可以考慮釋出,有時間的話我也可以考慮用別的架構
fit看看一個model
David avatar
By David
at 2022-07-08T19:39
因為結果沒很好所以沒打算要上傳 大大如果你要的話
再來信給我 我再把這次的資料給你~
Harry avatar
By Harry
at 2022-07-04T10:30
我前處理只有cleaning和正規化而已 之後再試試看怎
麼有系統的features select

即使大職籃時代,卻仍沒有球打的球員

Noah avatar
By Noah
at 2022-07-08T10:18
現在職籃球隊數量達到台灣籃球史上最高峰 甚至是第二高的兩倍多 假使每隊可有15個人 全部好歹也有 240 人 若t1加一隊的謠言屬實 那人數還會再恢復到去年的標準 那是否有大家認為有實力 卻仍然沒有趁機出現在職業舞台的人呢? 我自己有想到邱金龍、陳柏宏 林金榜、張智峰、劉元凱都復出了 為 ...

李德威兒子多多開示

Andrew avatar
By Andrew
at 2022-07-08T08:25
https://youtu.be/pE5WGj7Em9I DREAMURMUR|   #恐龍博士 #李多多 開示了…… #李德威 #NoDoubt #無庸置疑 #GoDreamers #台新挺有夢想的 #台新銀行 - 多多也太可愛了吧! 還有一隻龍XDD 這影片蠻猛的 - ...

T1選秀球探報告 砍將林子洧有望成黑馬

James avatar
By James
at 2022-07-08T06:28
https://tinyurl.com/bdh9cpv8 T1選秀球探報告 砍將林子洧有望成黑馬 2022年07月08日 05:05 記者杜奕君/綜合報導 T1職籃選秀將於7月12日下午16時登場,聯盟在6日公布44位符合報名資格之選秀球員名單 後,也陸續推出待選新秀之「球探報告」,高師大主力砍 ...

嘗試以機器學習排出P+前三隊

Tom avatar
By Tom
at 2022-07-08T04:58
大家好 前陣子世界賽,看到很多人在討論P+前兩隊的選人標準 突然想到我曾經做過類似的專題(感興趣的人可以A我文章看,但很簡略xD) 因此決定再做一次,看看是不是與媒體投票的結果有所差異~ 先打預防針,這是機器學習的結果,基本上就是個黑盒子,所以大家看看就好,別太認真! - 懶人包: 以 PCA+t-SN ...

NBA等級體測 虎科籃球隊全力拼戰新賽

Harry avatar
By Harry
at 2022-07-08T00:45
https://tsna.com/article/58904 NBA等級體測 虎科籃球隊全力拼戰新賽季 作者:編輯部 2022年7月7日 14:29 國立虎尾科技大學籃球隊於今年五月結束UBA大專籃球聯賽,為備戰新賽季,已開始進行 暑假集訓,積極提升運動表現與成績,並力爭晉升UBA大專籃球聯賽公 ...