國際網壇驚爆打假球 連溫布頓公開賽也淪 - 網球 Tennis
By Adele
at 2016-01-20T00:20
at 2016-01-20T00:20
Table of Contents
看起來是用大數據分析出來的 而不是有什麼直接證據 所以先觀望吧
[轉]BuzzFeed 如何透過演算法,找出打假球網球選手
新聞網站 BuzzFeed 以善於挖掘眼球著稱,其新聞經常能炮製出很多話題。其中的奧秘在
於它是一家以數據為驅動的公司。現在這家網站又利用大數據做出了一篇有關頂級男子網
球選手打假球的深度報導。該網站的記者 John Templon 與 BBC 通過利用演算法,對 20
09 到 2015年 的 26000 場 ATP 與大滿貫頂級男子網球賽進行了分析,經過長達 15 個
月的艱苦調查後,他們得出了涉嫌打假球的場次和球員名單。不過文章並未披露具體球員
名字,但其中一個的重量級的消息是,其中有位是排名前 50 的男選手,目前正在澳網打
比賽。
Templon 首先跟體育彩券的調查員建立起一個測量指標—賽前賠率變化(收盤相對開盤)
超過 10 個百分點的賽事。然後對每位球員進行了 100 萬次的模擬運算來評估選手打假
球的置信度。最後在 26000 場比賽中找到了 39 位嫌疑人,其中有 15 位選手往往在下
重注的比賽當中經常會輸掉。有一位選手在 16 場下了重注的比賽中輸了 15 場。
儘管這種模式的匹配並不能證明球員打假球,但是正常情況下,每每有人下重注押某位球
員會輸時他總是會表現不佳的可能性也是非常低的。Templon 稱根據他的模擬結果,按照
彩券公司最初開出的賠率,這名選手預期會輸掉比賽的幾率應該不會超過 1/7500。文章
並沒有透露選手名字,但稱涉嫌打假球的球員是排名前 50 的選手之一,目前還正在澳網
公開賽打比賽。
BuzzFeedNews 在 Github 上共享了與 BBC 合作的這篇名為網壇騙局文章的調查方法、原
始數據以及演算法過程,其分析步驟大概是這樣的:
1、數據獲取。從 7 家彩券公司下載 2009年 至 2015年9月 間 26000 場 ATP、大滿貫比
賽的開盤賠率和收盤賠率。
2、數據準備。準備比賽賠率數據集,內容包括每家彩券公司為每場比賽開出的賠率,比
賽雙方選手、比賽結果、賠率變化情況等(將近 13 萬條記錄)。其中還根據賠率情況計
算了每位選手的獲勝幾率(對方賠率 /(對方賠率 + 選手賠率))。
3、賽事排除。將取消的比賽、開盤賠率高於或低於所有彩券公司賠率中位數 10%的賠率
排除在外,共剩下 25993 場比賽。
4、賠率變化計算。計算開盤和收盤賠率變化情況,如果選手 A 開盤勝率為 65%,收盤卻
變成 50%,則賠率變化為 15 個百分點。
5、選手選擇。選出賠率變化超過 10%的選手(有 11%的比賽出現這種情況)。10%這個數
據是跟彩券公司調查員討論後定下來的,超過這個數後彩券公司一般都會對賽事進行嚴格
調查。然後再選出輸掉超過 10 場這樣賠率變化大的比賽的選手。最後發現有 39 名選手
符合上述條件。
6、模擬。這一步用來估計每位選手比賽的結果的不可能程度。利用開盤時每位選手的獲
勝幾率來生成一連串的結果。每位選手要進行 100 萬次模擬運算。
7、顯著性檢驗。然後對每位選手的結果進行顯著性檢驗。最後發現有 4 位選手打假球的
可信度達到 95%。另 11 位選手儘管沒到達這種可信度,但輸球的幾率仍然低於 5%。
數據無疑可以幫助調查人員很多事情,尤其是利用演算法對數據進行大規模分析在新聞組
織中屬於很罕見的例子。但是光靠數據科學家或者分析師來做調查是會存在巨大風險的,
記者本人也需要對數據嫻熟,對瞭解事實嚴格要求。這種技術的配合應該是讓新聞故事符
合事實,而不是拼湊出數據來配合故事。
而這次的大數據還只是利用了賠率分析,隨著人工智慧技術的發展和賽事轉播記錄的豐富
,將來每一位球員的一舉一動、表情神態可能都會被記錄下來,運用大數據和人工智慧進
行動作分析、微表情分析,那時候數據能說明的東西也許會更多。
本文出處:36Kr
來源: https://share.inside.com.tw/posts/22826
--
[轉]BuzzFeed 如何透過演算法,找出打假球網球選手
新聞網站 BuzzFeed 以善於挖掘眼球著稱,其新聞經常能炮製出很多話題。其中的奧秘在
於它是一家以數據為驅動的公司。現在這家網站又利用大數據做出了一篇有關頂級男子網
球選手打假球的深度報導。該網站的記者 John Templon 與 BBC 通過利用演算法,對 20
09 到 2015年 的 26000 場 ATP 與大滿貫頂級男子網球賽進行了分析,經過長達 15 個
月的艱苦調查後,他們得出了涉嫌打假球的場次和球員名單。不過文章並未披露具體球員
名字,但其中一個的重量級的消息是,其中有位是排名前 50 的男選手,目前正在澳網打
比賽。
Templon 首先跟體育彩券的調查員建立起一個測量指標—賽前賠率變化(收盤相對開盤)
超過 10 個百分點的賽事。然後對每位球員進行了 100 萬次的模擬運算來評估選手打假
球的置信度。最後在 26000 場比賽中找到了 39 位嫌疑人,其中有 15 位選手往往在下
重注的比賽當中經常會輸掉。有一位選手在 16 場下了重注的比賽中輸了 15 場。
儘管這種模式的匹配並不能證明球員打假球,但是正常情況下,每每有人下重注押某位球
員會輸時他總是會表現不佳的可能性也是非常低的。Templon 稱根據他的模擬結果,按照
彩券公司最初開出的賠率,這名選手預期會輸掉比賽的幾率應該不會超過 1/7500。文章
並沒有透露選手名字,但稱涉嫌打假球的球員是排名前 50 的選手之一,目前還正在澳網
公開賽打比賽。
BuzzFeedNews 在 Github 上共享了與 BBC 合作的這篇名為網壇騙局文章的調查方法、原
始數據以及演算法過程,其分析步驟大概是這樣的:
1、數據獲取。從 7 家彩券公司下載 2009年 至 2015年9月 間 26000 場 ATP、大滿貫比
賽的開盤賠率和收盤賠率。
2、數據準備。準備比賽賠率數據集,內容包括每家彩券公司為每場比賽開出的賠率,比
賽雙方選手、比賽結果、賠率變化情況等(將近 13 萬條記錄)。其中還根據賠率情況計
算了每位選手的獲勝幾率(對方賠率 /(對方賠率 + 選手賠率))。
3、賽事排除。將取消的比賽、開盤賠率高於或低於所有彩券公司賠率中位數 10%的賠率
排除在外,共剩下 25993 場比賽。
4、賠率變化計算。計算開盤和收盤賠率變化情況,如果選手 A 開盤勝率為 65%,收盤卻
變成 50%,則賠率變化為 15 個百分點。
5、選手選擇。選出賠率變化超過 10%的選手(有 11%的比賽出現這種情況)。10%這個數
據是跟彩券公司調查員討論後定下來的,超過這個數後彩券公司一般都會對賽事進行嚴格
調查。然後再選出輸掉超過 10 場這樣賠率變化大的比賽的選手。最後發現有 39 名選手
符合上述條件。
6、模擬。這一步用來估計每位選手比賽的結果的不可能程度。利用開盤時每位選手的獲
勝幾率來生成一連串的結果。每位選手要進行 100 萬次模擬運算。
7、顯著性檢驗。然後對每位選手的結果進行顯著性檢驗。最後發現有 4 位選手打假球的
可信度達到 95%。另 11 位選手儘管沒到達這種可信度,但輸球的幾率仍然低於 5%。
數據無疑可以幫助調查人員很多事情,尤其是利用演算法對數據進行大規模分析在新聞組
織中屬於很罕見的例子。但是光靠數據科學家或者分析師來做調查是會存在巨大風險的,
記者本人也需要對數據嫻熟,對瞭解事實嚴格要求。這種技術的配合應該是讓新聞故事符
合事實,而不是拼湊出數據來配合故事。
而這次的大數據還只是利用了賠率分析,隨著人工智慧技術的發展和賽事轉播記錄的豐富
,將來每一位球員的一舉一動、表情神態可能都會被記錄下來,運用大數據和人工智慧進
行動作分析、微表情分析,那時候數據能說明的東西也許會更多。
本文出處:36Kr
來源: https://share.inside.com.tw/posts/22826
--
Tags:
網球
All Comments
By Aaliyah
at 2016-01-22T04:57
at 2016-01-22T04:57
By Mary
at 2016-01-24T09:34
at 2016-01-24T09:34
By Dorothy
at 2016-01-26T14:11
at 2016-01-26T14:11
By Queena
at 2016-01-28T18:48
at 2016-01-28T18:48
By George
at 2016-01-30T23:25
at 2016-01-30T23:25
By Elma
at 2016-02-02T04:02
at 2016-02-02T04:02
By Erin
at 2016-02-04T08:39
at 2016-02-04T08:39
By Zenobia
at 2016-02-06T13:17
at 2016-02-06T13:17
By Sarah
at 2016-02-08T17:54
at 2016-02-08T17:54
By Erin
at 2016-02-10T22:31
at 2016-02-10T22:31
By Ursula
at 2016-02-13T03:08
at 2016-02-13T03:08
By Frederica
at 2016-02-15T07:45
at 2016-02-15T07:45
By Michael
at 2016-02-17T12:22
at 2016-02-17T12:22
By Vanessa
at 2016-02-19T16:59
at 2016-02-19T16:59
By Oliver
at 2016-02-21T21:36
at 2016-02-21T21:36
By Oliver
at 2016-02-24T02:14
at 2016-02-24T02:14
By Heather
at 2016-02-26T06:51
at 2016-02-26T06:51
By Lydia
at 2016-02-28T11:28
at 2016-02-28T11:28
By Tracy
at 2016-03-01T16:05
at 2016-03-01T16:05
By Rachel
at 2016-03-03T20:42
at 2016-03-03T20:42
By Leila
at 2016-03-06T01:19
at 2016-03-06T01:19
By Delia
at 2016-03-08T05:56
at 2016-03-08T05:56
By Linda
at 2016-03-10T10:33
at 2016-03-10T10:33
By Elma
at 2016-03-12T15:10
at 2016-03-12T15:10
By Annie
at 2016-03-14T19:48
at 2016-03-14T19:48
By Ula
at 2016-03-17T00:25
at 2016-03-17T00:25
By Mary
at 2016-03-19T05:02
at 2016-03-19T05:02
By Annie
at 2016-03-21T09:39
at 2016-03-21T09:39
By Kumar
at 2016-03-23T14:16
at 2016-03-23T14:16
By Yuri
at 2016-03-25T18:53
at 2016-03-25T18:53
By Lauren
at 2016-03-27T23:30
at 2016-03-27T23:30
By Anonymous
at 2016-03-30T04:07
at 2016-03-30T04:07
By Frederic
at 2016-04-01T08:45
at 2016-04-01T08:45
By Sarah
at 2016-04-03T13:22
at 2016-04-03T13:22
By Isla
at 2016-04-05T17:59
at 2016-04-05T17:59
By Cara
at 2016-04-07T22:36
at 2016-04-07T22:36
By Caroline
at 2016-04-10T03:13
at 2016-04-10T03:13
By Kama
at 2016-04-12T07:50
at 2016-04-12T07:50
By Edward Lewis
at 2016-04-14T12:27
at 2016-04-14T12:27
By Selena
at 2016-04-16T17:04
at 2016-04-16T17:04
By Tristan Cohan
at 2016-04-18T21:41
at 2016-04-18T21:41
By Bethany
at 2016-04-21T02:19
at 2016-04-21T02:19
By Frederica
at 2016-04-23T06:56
at 2016-04-23T06:56
By Mason
at 2016-04-25T11:33
at 2016-04-25T11:33
By Mason
at 2016-04-27T16:10
at 2016-04-27T16:10
By Carol
at 2016-04-29T20:47
at 2016-04-29T20:47
By James
at 2016-05-02T01:24
at 2016-05-02T01:24
By Harry
at 2016-05-04T06:01
at 2016-05-04T06:01
By Suhail Hany
at 2016-05-06T10:38
at 2016-05-06T10:38
By Dinah
at 2016-05-08T15:15
at 2016-05-08T15:15
By Wallis
at 2016-05-10T19:53
at 2016-05-10T19:53
By Susan
at 2016-05-13T00:30
at 2016-05-13T00:30
By Sandy
at 2016-05-15T05:07
at 2016-05-15T05:07
By Ida
at 2016-05-17T09:44
at 2016-05-17T09:44
Related Posts
2016 Australian Open day 2 (1/19)
By Ivy
at 2016-01-19T21:15
at 2016-01-19T21:15
2016 AO 票種問題
By Adele
at 2016-01-19T20:38
at 2016-01-19T20:38
S. Wawrinka [4] vs. D. Tursunov - R1
By Andrew
at 2016-01-19T17:50
at 2016-01-19T17:50
【買賣】澳網男女單四強門票
By Rosalind
at 2016-01-19T17:31
at 2016-01-19T17:31
爆冷!男單西班牙內戰 納達爾2比3首輪出局
By Steve
at 2016-01-19T17:22
at 2016-01-19T17:22