國際網壇驚爆打假球 連溫布頓公開賽也淪 - 網球 Tennis

Table of Contents

看起來是用大數據分析出來的 而不是有什麼直接證據 所以先觀望吧

[轉]BuzzFeed 如何透過演算法,找出打假球網球選手

新聞網站 BuzzFeed 以善於挖掘眼球著稱,其新聞經常能炮製出很多話題。其中的奧秘在
於它是一家以數據為驅動的公司。現在這家網站又利用大數據做出了一篇有關頂級男子網
球選手打假球的深度報導。該網站的記者 John Templon 與 BBC 通過利用演算法,對 20
09 到 2015年 的 26000 場 ATP 與大滿貫頂級男子網球賽進行了分析,經過長達 15 個
月的艱苦調查後,他們得出了涉嫌打假球的場次和球員名單。不過文章並未披露具體球員
名字,但其中一個的重量級的消息是,其中有位是排名前 50 的男選手,目前正在澳網打
比賽。

Templon 首先跟體育彩券的調查員建立起一個測量指標—賽前賠率變化(收盤相對開盤)
超過 10 個百分點的賽事。然後對每位球員進行了 100 萬次的模擬運算來評估選手打假
球的置信度。最後在 26000 場比賽中找到了 39 位嫌疑人,其中有 15 位選手往往在下
重注的比賽當中經常會輸掉。有一位選手在 16 場下了重注的比賽中輸了 15 場。

儘管這種模式的匹配並不能證明球員打假球,但是正常情況下,每每有人下重注押某位球
員會輸時他總是會表現不佳的可能性也是非常低的。Templon 稱根據他的模擬結果,按照
彩券公司最初開出的賠率,這名選手預期會輸掉比賽的幾率應該不會超過 1/7500。文章
並沒有透露選手名字,但稱涉嫌打假球的球員是排名前 50 的選手之一,目前還正在澳網
公開賽打比賽。

BuzzFeedNews 在 Github 上共享了與 BBC 合作的這篇名為網壇騙局文章的調查方法、原
始數據以及演算法過程,其分析步驟大概是這樣的:

1、數據獲取。從 7 家彩券公司下載 2009年 至 2015年9月 間 26000 場 ATP、大滿貫比
賽的開盤賠率和收盤賠率。

2、數據準備。準備比賽賠率數據集,內容包括每家彩券公司為每場比賽開出的賠率,比
賽雙方選手、比賽結果、賠率變化情況等(將近 13 萬條記錄)。其中還根據賠率情況計
算了每位選手的獲勝幾率(對方賠率 /(對方賠率 + 選手賠率))。

3、賽事排除。將取消的比賽、開盤賠率高於或低於所有彩券公司賠率中位數 10%的賠率
排除在外,共剩下 25993 場比賽。

4、賠率變化計算。計算開盤和收盤賠率變化情況,如果選手 A 開盤勝率為 65%,收盤卻
變成 50%,則賠率變化為 15 個百分點。

5、選手選擇。選出賠率變化超過 10%的選手(有 11%的比賽出現這種情況)。10%這個數
據是跟彩券公司調查員討論後定下來的,超過這個數後彩券公司一般都會對賽事進行嚴格
調查。然後再選出輸掉超過 10 場這樣賠率變化大的比賽的選手。最後發現有 39 名選手
符合上述條件。

6、模擬。這一步用來估計每位選手比賽的結果的不可能程度。利用開盤時每位選手的獲
勝幾率來生成一連串的結果。每位選手要進行 100 萬次模擬運算。

7、顯著性檢驗。然後對每位選手的結果進行顯著性檢驗。最後發現有 4 位選手打假球的
可信度達到 95%。另 11 位選手儘管沒到達這種可信度,但輸球的幾率仍然低於 5%。

數據無疑可以幫助調查人員很多事情,尤其是利用演算法對數據進行大規模分析在新聞組
織中屬於很罕見的例子。但是光靠數據科學家或者分析師來做調查是會存在巨大風險的,
記者本人也需要對數據嫻熟,對瞭解事實嚴格要求。這種技術的配合應該是讓新聞故事符
合事實,而不是拼湊出數據來配合故事。

而這次的大數據還只是利用了賠率分析,隨著人工智慧技術的發展和賽事轉播記錄的豐富
,將來每一位球員的一舉一動、表情神態可能都會被記錄下來,運用大數據和人工智慧進
行動作分析、微表情分析,那時候數據能說明的東西也許會更多。

本文出處:36Kr


來源: https://share.inside.com.tw/posts/22826

--

All Comments

Aaliyah avatarAaliyah2016-01-22
除非有生命危險 不然想不到他們有打假球的理由
Mary avatarMary2016-01-24
有誰呀
Dorothy avatarDorothy2016-01-26
容易在下重注的比賽輸球不一定是防水啊
Queena avatarQueena2016-01-28
可能只是心理素質不好關鍵時刻會軟手放水
George avatarGeorge2016-01-30
關鍵時刻軟手 這樣名單不就更明確了XD
Elma avatarElma2016-02-02
用賠率算輸球likelihood還需要跑模擬 這是在搞什麼鬼...
Erin avatarErin2016-02-04
垃圾媒體想紅還這樣出來害人 沒品到極點
Zenobia avatarZenobia2016-02-06
先想到尼尼...
Sarah avatarSarah2016-02-08
感覺前十的選手不太可能放水 如果被查出來那代價太高了
Erin avatarErin2016-02-10
但是前五十名的確有可能靠這種方式賺外快 希望不要有
Ursula avatarUrsula2016-02-13
基本上 男子前四若有假球是腦袋壞掉 因為代言滿點但5名之後還真的都很難說...女子的話...從打球內容
Frederica avatarFrederica2016-02-15
看起來大多數都像假球 所以很難判斷 (誤
Michael avatarMichael2016-02-17
女的真的一堆感覺超扯的 哈哈
Vanessa avatarVanessa2016-02-19
女網太多太瞎了 真的假的根本分不出來吧...
Oliver avatarOliver2016-02-21
女網軟手多到都覺得無感了
Oliver avatarOliver2016-02-24
沒錢就是理由吧
Heather avatarHeather2016-02-26
溫布頓不是錦標賽嗎 =.=
Lydia avatarLydia2016-02-28
看了buzzfeed的原文 除了大數據還有'a cache of leak
Tracy avatarTracy2016-03-01
Leaked docs from inside the sport-the fixing file
Rachel avatarRachel2016-03-03
推女網真假已經分辨不出來了XD
Leila avatarLeila2016-03-06
前四真的沒有理由 十名外的就有可能 畢竟謀生不易
Delia avatarDelia2016-03-08
ATP應該檢討一下自己的獎金分配 為甚麼會導致前十跟十名外的差距這麼大
Linda avatarLinda2016-03-10
其實每項職業運動都是這樣 這沒甚麼好檢討 = =有本事拿下這麼多錢的人的確就是這麼少 這是現實
Elma avatarElma2016-03-12
也是個人實力
Annie avatarAnnie2016-03-14
檢討?ATP又不是照排名發薪水的XD
Ula avatarUla2016-03-17
大滿貫冠軍的話應該不只男單吧
Mary avatarMary2016-03-19
winner takes all已經飽受選手詬病了 怎會不需檢討?
Annie avatarAnnie2016-03-21
世界實力第50強的足球員 可能是哪裡的明星中鋒 年領N百萬歐
Kumar avatarKumar2016-03-23
所得如此M型化 只會不利於這項運動發展
Yuri avatarYuri2016-03-25
世界實力第50強的足球員是從哪來的?哪個機構可以這樣排名?
Lauren avatarLauren2016-03-27
團體賽是球團簽約付薪水,運作方式和個人賽運動差太多啦
Anonymous avatarAnonymous2016-03-30
人數差這麼多 本來就不公平
Frederic avatarFrederic2016-04-01
不然你想ATP該怎麼讓排名100的選手年收有第1名的百分之1?
Sarah avatarSarah2016-04-03
各大賽獎金由ATP全部沒收,年終按照每人排名依比例發放??
Isla avatarIsla2016-04-05
winner takes all 飽受誰詬病了 (疑惑)
Cara avatarCara2016-04-07
拿足球這種來類比更怪異...= =
Caroline avatarCaroline2016-04-10
http://goo.gl/2RoCuS http://goo.gl/4YgDuq
Kama avatarKama2016-04-12
http://goo.gl/W2uMQ1 類比或許不完全適當 但網壇所得結構
Edward Lewis avatarEdward Lewis2016-04-14
之畸形扼殺了很多選手出頭的機會 或許也間接造成近年的壟斷
Selena avatarSelena2016-04-16
出不了頭不是因為實力不夠嗎??還是說他們賺飽了就能出頭??
Tristan Cohan avatarTristan Cohan2016-04-18
簡單講,應該調整獎金制度,讓比賽前四名之外的選手也能有適當的、體面的、有尊嚴的收入
Bethany avatarBethany2016-04-21
縮小排名之間的收入差距。
Frederica avatarFrederica2016-04-23
適當體面有尊嚴的收入是誰來定...又不是共產黨= =
Mason avatarMason2016-04-25
該算好的晉級階段性收入就是這樣 要贏多一點錢就是贏下更多場的比賽
Mason avatarMason2016-04-27
多贏一場酬勞要多拿一坎,這樣才有拚的動力
Carol avatarCarol2016-04-29
納豆老費都有在批評 前幾輪賽事給的獎金太少
James avatarJames2016-05-02
這個社會被教育得好像共產主義是毒一樣 當別人要求公平
Harry avatarHarry2016-05-04
的時候 就會有人拿共產主義來說這不對那不對
Suhail Hany avatarSuhail Hany2016-05-06
大老遠搭飛機去比賽 贏了一場比賽卻連付機票錢都不夠這制度最好是沒問題啦
Dinah avatarDinah2016-05-08
所以小型賽事算是嘉惠本土選手啊(交通成本較低)
Wallis avatarWallis2016-05-10
主要是資源被拿來墊高前幾名的獎金,那前幾輪自然比較少
Susan avatarSusan2016-05-13
主辦單位也會算的,前幾名獎金不砍 那前幾輪酬勞當然不多
Sandy avatarSandy2016-05-15
你砍了前幾名獎金分配到前幾輪,就會變成明星大咖不來
Ida avatarIda2016-05-17
票房不好 贊助商覺得注目度太低不想砸錢 最後可能辦到虧錢