狀況內與狀況外 - 棒球

Table of Contents

其實當神棍還是蠻有趣的...
延續一下去年的模型: 用 Poisson distribution 研究投手表現.

首先有一個基本的問題...
小王今年越來越猛了.
而我好奇的就是, 如何評估他這些場次的表現?

7/03 MIN 7.0 IP, 7/08 LAA 6.1 IP 兩場一路塞鴨蛋的比賽當然沒話講.
可是天使的火力比雙城要猛, 撐 6.1 局跟撐 7.0 局的表現哪個好?
又譬如白襪今年的打擊實在太悲了...
那麼對 6/06 白襪投了九局掉一分, 相較於 5/05 對西雅圖投了八局掉一分.
到底哪個難度比較高?
另外那種 6.0 局掉四分, 跟 5.2 局掉三分的又要怎麼比, 也是很麻煩.

所以只好開壇作法, 呼喚 Poisson 大神.

當然還是要用幾句話描述一下整個模型的概念.
我們一樣假設: 一場棒球比賽的得分, 對於局數來說呈現卜松分佈.
然後把整個美聯賽事看成一個投手跟一個打者對決.
成績是 1546 場比賽失 7546 分.
或者說這是 R/9 = 4.88 的卜松投手對決 RS/9 = 4.88 的卜松打者.
兩個人打了........................嗯, 一千多場比賽.

現實投手的作用是什麼?
以小王做例子, 小王投 136.2 局失 53 分.
他可以把 RS/9 = 4.88 的 Poisson trial 壓制成 RS/9 = 3.49.
對攻擊來說呢, Yankees 在 111 場比賽裡頭打了 660 分.
所以 Yankees 可以把 R/9 = 4.88 的 Poisson trial 打成 R/9 = 5.95.

從上面這一段可以算出小王對決洋基的失分期望值...
我講得很抽象, 然而算式很簡單, 因為卜松大神的特色就是線性. :P
小王 vs NYY, 投七局的情況下, 失分期望值應該會是...

4.88 * (3.49 / 4.88) * (5.95 / 4.88) * 7 / 9 = 3.31

就是說大概掉三分多左右.

交代完畢... 來看結果.
──────────────
AL games: 1546, runs: 7546
NL games: 1770, runs: 8104
王建民: R = 53, IP = 136.2

──────────────────────────────────────
日期 勝 隊伍 局數 失分 火力表 應失分 再壓制率 持平 再失分率
──────────────────────────────────────
7/03 W MIN 7.0 0 110/507 2.56 ------ 7.70% 92.30%
7/08 W LAA 6.1 0 110/554 2.53 ------ 7.93% 92.07%
6/06 W @CWS 9.0 1 111/480 3.09 4.54% 14.04% 81.42%
5/05 W SEA 8.0 1 109/526 3.07 4.65% 14.28% 81.07%
8/03 W KC 7.0 1 110/512 2.59 7.51% 19.45% 73.04%
6/12 W NL-ARI 7.0 1 113/467 2.45 8.63% 21.14% 70.24%
5/16 W @CWS 7.0 1 111/480 2.41 9.03% 21.71% 69.27%
6/17 W NL-NYM 8.2 2 111/519 3.43 14.32% 19.03% 66.64%
5/21 W BOS 6.1 2 111/574 2.60 26.70% 25.09% 48.21%
5/26 L LAA 8.0 3 110/554 3.20 37.97% 22.26% 39.77%
7/19 L TOR 7.1 3 110/512 2.71 49.07% 22.08% 28.85%
──────────────────────────────────────
6/01 W @BOS 5.2 3 111/574 2.33 58.86% 20.50% 20.64%
7/14 W @TB 6.0 3 110/512 2.22 61.77% 19.80% 18.44%
7/29 W @BAL 6.0 3 110/503 2.18 62.81% 19.52% 17.67%
4/29 L BOS 6.0 4 111/574 2.47 76.50% 13.08% 10.42%
4/24 L @TB 6.1 4 110/512 2.34 79.07% 12.05% 8.88%
6/23 NL-@SF 6.1 4 109/466 2.29 80.07% 11.63% 8.30%
7/24 W @KC 6.0 4 110/512 2.22 81.56% 10.98% 7.46%
6/28 @BAL 6.1 6 110/503 2.30 97.00% 2.06% 0.94%
5/10 L TEX 6.1 7 111/533 2.42 98.80% 0.85% 0.35%
──────────────────────────────────────

以這張表來說, 預測失分跟實際失分的理論誤差大約是 1.65 分左右.
模式符合得有點誇張, 我不知道其他投手會不會這樣子. O_o
然而請不要叫我深入研究, 抄寫數據很麻煩... :P

解釋兩個名詞...
「再壓制率」是說: 如果又打一場, 小王有多大的可能會讓失分更低...
「再失分率」剛好反過來, 是說對手有什麼樣的機會可以打得更好.

舉 7/19 L TOR 7.1IP 3R 那一場來說.
如果再一次 7.1 局對決, 小王讓失分更低的機率是 50% (49.07%) 左右.
而藍鳥要打得更好的機會只有不到三成 (28.85%).
另外兩成多的結果不變...

裡頭可以看到兩場, 5/26 LAA, 7/19 TOR 算是狀況內還敗投.
話說回來, 狀況外還勝投的有 6/01, 7/14, 7/24, 7/29 四場. :P
不過只有 5/26 LAA 敗得比較冤, 7/24 @KC 勝得比較虛.

請注意, 這邊都是自己跟自己比.
全盛時期的 Randy Johnson 就算狀況不太好, 應該也是大殺四方.
而且這是攻守雙方的數據.
或許狀況未必差, 是對方的棒子也太燙了. :PPP

由好排到壞的結果, 大概長那個樣子.

────
這個模型還有一些有趣的地方...
譬如也可以計算: 小王今天拿出了十場只會出現一場的壓制力.
對決紅襪也是十場只會出現一場的火力...
會怎麼樣?

來算算對戰的勝敗機率賺 P 幣也是可以啦.

只是呢, 那真的就是神棍之魂的領域了... :Q


--

新詩練習:新鮮。踩破初春裡的狗大便;不經意的滄桑,滿溢著嫩黃的喜悅。

--

All Comments

Edith avatarEdith2007-08-07
這篇大概又要M了 先來推XD
Agnes avatarAgnes2007-08-08
大推!!!
Liam avatarLiam2007-08-09
這一篇文章值 23 銀
Susan avatarSusan2007-08-10
哇靠 好強!!!推!!!
Hamiltion avatarHamiltion2007-08-10
統計魔人!!!!
Kama avatarKama2007-08-15
好強阿!!! 我雖然學過統計 不過還是一整個看不懂 囧
Todd Johnson avatarTodd Johnson2007-08-16
神棍成這樣,不推也不行
Andrew avatarAndrew2007-08-19
唉...可惜統計沒學好,不然用在棒球上應該蠻好玩得
Faithe avatarFaithe2007-08-20
묠這一篇文章值 23 銀
Regina avatarRegina2007-08-24
老實說 有一點複雜!!
Joe avatarJoe2007-08-29
其實我ㄧ直想問 有人常推文說:這篇文章值幾元
Carol avatarCarol2007-09-03
是要做什麼啊?有什麼用意嗎?
Rachel avatarRachel2007-09-06
推推
Elvira avatarElvira2007-09-10
有看沒懂 真慚愧 我是統計系的...
Skylar DavisLinda avatarSkylar DavisLinda2007-09-15
就看完比賽的感覺
Candice avatarCandice2007-09-19
一整個 Data 分析魔人,要是我作實驗也有這種精神就好了
Yuri avatarYuri2007-09-22
給happiness2:因為一篇很長的文章,通常得到的P幣不少
Odelette avatarOdelette2007-09-24
而 P幣太少有可能是複製貼上。
Lauren avatarLauren2007-09-27
所以有些人會用這個來判斷是不是自己打的。
Tracy avatarTracy2007-09-27
不過有時候也只是貼好玩的啦!XD
Heather avatarHeather2007-09-28
也不能這樣說,PTT現在的狀況沒人敢在上面打長文吧囧
Joe avatarJoe2007-09-30
在文章列表那文章前按下shift+q 就可以查該文po完得的p幣
Kyle avatarKyle2007-10-03
再看內容,可以判斷出是純灌水騙p幣或是貼上的或是直接打
Odelette avatarOdelette2007-10-06
字的,大概這樣,基本上我把這功能當成小遊戲偶爾為之
Ethan avatarEthan2007-10-10
給caten:我沒有說這篇不是自己打的意思啦!XD
Ursula avatarUrsula2007-10-15
我比較想知道 為何可以假設這是卜瓦松分配?!
Doris avatarDoris2007-10-16
原po可以去買運動彩卷啦
Hazel avatarHazel2007-10-18
這是你的論文題目吧
Oliver avatarOliver2007-10-19
上三樓可以去搜原po以前的文
Anthony avatarAnthony2007-10-19
還頗送 ~_~ 要不要那麼專業啊........