棒球預測系統到底準不準? 我在這個禮拜二曾經在MLB Corner發文,該篇文章以今年球季被預測大約是美聯中段班的洋基做為例子,我在文章說明預測系統沒辦法預測的不確定性,162場比賽事實上是不夠長到足以抵消運氣在一個球季之內的影響的,但是我也在該篇文章說過預測系統的公信力是足夠的,衡量單獨球員的時候也有一定的準確性,那麼預測系統,尤其是團隊預測勝場數這種東西,到底準不準? 禮拜二的文章我舉了很多實例來解釋為什麼團隊預測理所當然的會有誤差,因為運氣是無法預測的,而運氣會在把壘上跑者轉換成分數時(投打兩端都包含),把得失分轉換成勝率的時候產生影響力,去年運動家隊和白襪隊打出同樣的0.312wOBA,結果前者多得了70分;金鶯擁有比天使隊微高的wOBA,後者卻多得了68分,預測系統沒辦法預期到這些事情, 另外在得失分差轉換成勝場方面,藍鳥隊去年擁有比紅雀更好的得失分差,戰績卻落後紅雀7場比賽,運動家隊在擁有全大聯盟最好的得失分差但只贏了88場,這同樣沒辦法預測,加上季中交易球隊陣容可能的變動以及同樣牽涉部分運氣的傷兵問題同樣無法預測, 所以在禮拜二的文章中,我的重點就是所有球隊的預測值絕對都有參考價值,預測是電腦告訴我們這些球隊的預期戰力,但運氣會影響一些比賽,所以在那篇文章我才說球隊的預測你可以算入一些可能的誤差,這誤差比較可能是運氣所致,但無論如何,被預期可以打出81勝的球隊,這支球隊是可能贏到86,87場,也有可能贏………75場,因為運氣, 不過除了提出理論,我今天在這裡會有更實際的方法,討論團隊勝場的預測準確範圍,我將會拿出過去五年球季,也就是從2010年開始逐季的預測勝場和最後球隊實拿的勝場數做比較,預測勝場參考幾個預測系統Zips,Steamer,
老虎機
Pecota,
金旺娛樂城
Marcel,然後把這些預測系統每年開季前對各球隊的預測勝場做平均,然後看看球隊最後實際拿下的勝場數和預測系統的預測做比較, 因為是從2010年開始,所有總共有五年合計150支球隊的樣本,預測的紀錄事實上可以追溯到2005年,但我的想法是也許拿最近五年的預測來說明預測系統的準確度比較客觀,因為近年預測系統的確比以前更進步,元素更豐富而且數據的發展越來越完善,因此我將拿近五年做為我的樣本, 我自己(花了不少時間)計算出這150支球隊的預測勝場和實際勝場的差距,而在這段話的下面,我將會列出自從2010開始,逐年球季的球隊預測/實際勝場數的誤差值,並依據誤差範圍來分組,然後我會列出各組的隊數,0~5代表球隊的實際勝場和預期勝場的誤差在0~5勝之內,21+代表誤差大於21場比賽, OK,已經夠多廢話了,我們接下來就來看一些你會感興趣的數字而不是廢話, 2010年, 誤差值0~5場,13隊 誤差值6~10場,9隊 誤差值11~15場,5隊 誤差值16~20場,
多寶彩票
3隊 誤差值21+場,0隊 2011年 誤差值0~5場,11隊 誤差值6~10場,14隊 誤差值11~15場,3隊 誤差值16~20場,1隊 誤差值21+場,1隊 2012年 誤差值0~5場,13隊 誤差值6~10場,9隊 誤差值11~15場,4隊 誤差值16~20場,1隊 誤差值21+場,3隊 2013年 誤差值0~5場,
雷神之錘
15隊 誤差值6~10場,6隊 誤差值11~15場,8隊 誤差值16~20場,1隊 誤差值21+場,0隊 2014年 誤差值0~5場,21隊 誤差值6~10場,3隊 誤差值11~15場,3隊 誤差值16~20場,3隊 誤差值21+場,0隊 2010-2014年總和, 誤差值0~5場,73隊 誤差值6~10場,
RSG麻將發了
41隊 誤差值11~15場,23隊 誤差值16~20場,9隊 誤差值21+場,4隊 2010-2014年各組隊數占總隊數(150隊)的比例, 誤差值0~5場,48.6% 誤差值6~10場,27.3% 誤差值11~15場,18.3% 誤差值16~20場,6.0% 誤差值21+場,2.6% 你現在手上突然多了很多資料,不過有一件事情值得一提,從2011年開始,誤差在0~5勝範圍內的球隊支數,11,13,15,21隊,也就是連續四年,誤差最小的隊數呈現增長,我不知道這是巧合還是預測系統在進步,我不知道,但我只是告訴你這150隊樣本呈現的數據, 從2011年之後,誤差在6~10勝的隊數從2011年開始逐年下降,從2011年的14隊往下掉,2012年剩9隊,前年剩6隊,到去年只剩下3隊,所以我們可以說連續四年的時間,誤差值6-10勝這組漸漸的移動到誤差值0-5勝這組,我不確定這是不是代表預測系統在進步,又或者只是巧合,這只是檔案告訴我的資料,而我把它陳述出來, 不過我們把目光放在最後一組數據,這是過去五年時間總共150隊分布在各組的比率,預測系統到底準不準?這組數據可以拿來回答這個問題,過去五年,總共有大約一半的隊伍實際的勝場數和開季前預測的勝場在0-5場之間,舉個例子,以過去五年的平均數據為基準的話,一支被預測大約80勝左右的球隊有一半的機率可以贏超過75場,或是低於85場, 所以,如果你支持的球隊被預期可以拿75場勝利,那麼大概有一半的機率會拿70-80勝中間,但是有另外一半的機率會在這個範圍外,假設我們現在把範圍擴大到10場誤差,那麼大概會有四分之三的球隊在這個範圍內, 也就是說,有另外四分之一的球隊會比預測的戰績多贏10場以上或少輸10場以上,如果你支持的球隊被認為可以贏75場,那麼還是有大約四分之一的可能贏超過85場或低於65場,四隊中有一隊可能發生這種事情,但另外三隊會在10勝的誤差範圍內, 假設打進季後賽的最低門檻是85勝附近,那麼被預計可以贏75場的球隊可能只有八分之一(誤差可以讓球隊多贏10場以上也能多輸10場以上,各一半的機率,不能算進那些會比預測多輸十場以上的球隊)的機會接近這個門檻, 如果一支球隊被預期可以拿下80勝,那麼該球隊大概會有四分之一左右的機率接近85勝的季後賽門檻,因為根據前述,有50%的球隊和預測的誤差值會大於5場,這些球隊可能有一半會是比預測多輸5場以上的球隊,另外一半才是可以比預測多贏5場以上的球隊, 另外比較有趣的部分是和預測相差最遙遠的球隊,過去五年總共有9%的隊伍比預測多贏/輸15場比賽以上,也就是說被預期會打出70勝的球隊大概只有4.5%左右的機率贏超過85場比賽,另外4.5%會贏小於55場比賽, 根據上面這樣的邏輯,我自己計算了根據過去五年的樣本,被預計可以拿各種等級勝場的球隊有多大機率可以贏超過85場比賽,__ 被預測拿65勝,1.5% 被預測拿70勝,4.5% 被預測拿75勝,12.0% 被預測拿80勝,26.0% 被預測拿85勝,50.0% 被預測拿90勝,74.0% 被預測拿95勝,88.0% 被預測拿100勝,95.5% 被預測拿105勝,98.5%__ 因為預測的正負雙向誤差,所以即使被預測為可以贏85場比賽的球隊也有一半的機率沒辦法贏85場,也許這支球隊會贏84場或70場,只是機率的問題而已,
5298娛樂城
但這個表大概可以讓我們得知大約每四支被預測能贏80場比賽的球隊大約有一支可以贏超過85勝,也就是說這種球隊也都還會有季後賽機會,即使機率看起來不大,但我們在考試的時候,猜四選一選擇題偶爾不也會猜中? 不過也許你認為贏超過85場不是季後賽門票的保證班,事實上也是如此,即使在這個時代打進季後賽的門檻已經大幅降低,去年水手隊贏了87場,印第安人贏了85場雖然離季後賽只差一點但就是沒有打進去,所以讓我們現在把門檻拉到90勝,來看看下列球隊有多大機率可以超過這個門檻, __ 被預測拿70勝,1.5% 被預測拿75勝,4.5% 被預測拿80勝,12.0% 被預測拿85勝,26.0% 被預測拿90勝,50.0% 被預測拿95勝,74.0% 被預測拿100勝,88.0% 被預測拿105勝,95.5% 被預測拿110勝,98.5% __紅雀和老虎是去年兩支90勝就封王的球隊,如果說90勝是季後賽保證,也有機會挑戰分區王座,那麼你的球隊最好本來就要被預期可以贏85場,否則對被預期連85勝都贏不到的球隊,要贏90場以上的機率實在有限, 當然,這些數字都只是建立在過去五年總共150隊的樣本,這樣本當然沒有大到足以讓人信任,但我個人相信未來的預測系統應該不會比過去還要弱,所以這些數字的可信度應該不會隨著時間遞減,如果預測系統未來真的繼續在進步,那麼我這篇文就會變的有點高估弱隊並低估強隊,因為如果預測系統真的更精準,那麼被系統認為是弱隊的球隊會有更大的機率成真,誤差變小;被預測是強隊的隊伍也是相同道理, 但是即使是現在的預測系統,我認為已經非常不錯,我不知道過去四年年年遞減的誤差值是巧合還是預測真的有進步,但根據去年的數據,有21支球隊的預測誤差在5勝以內,這已經算是很棒的效率了,如果未來的預測系統能至少更去年一樣準,那麼這篇文的數據甚至可能低估預測系統的功力,因為這篇文是採用過去五年的平均數字,而去年預測系統的表現是過去五年來最好的一年, 我不知道這是巧合,還是代表什麼事情,我不知道,但是也許預測系統比一般球迷想像的還要更靠譜一些,但也許沒有精確到跟水晶球一樣,畢竟運氣真的沒辦法預測,而我之前就提到運氣在162場內可以改變非常多的事情,撇開運氣不談,我認為棒球預測系統已經是具有相當高參考價值的東西,而不是純粹「看看就好」的玩具, 至於對於被預測只能拿78勝或82勝球隊的球迷來說也不用太早絕望,對於這些球隊來說,以機率論來說也許每四支這種球隊有一支真的可以在季後賽露面, 歡迎指正/討論O(∩_∩) 歡迎光臨MLB Corner粉絲團收看更多棒球文章,也歡迎關注KaL El Sports運動粉絲團的其他運動的好文,, ,