BINGOBINGO
彭政閔本季目前至今,出賽11場,
皇家電子
共44個打席打了10支安打,算是差強人意的表現;比較令人擔心的是他目前為止只打出一支長打,而且那場比賽砲聲隆隆,雙方打到眼紅,若要說那支二壘安打有可能是靠著對方投手崩盤才打出來,也不會是不能接受的解釋。一個過去整個生涯從未有過打率低於三成的球季的打者,剛剛過了十分之一個賽季的出賽跟打席,竟然還在兩成之間掙扎,
金旺5298娛樂
直到昨天義大被痛打後才拉到了兩成七的打擊率,實在頗讓人意外。更讓人意外的是他幾乎完全消失的長打,
TU娛樂城
幸好他的選球還是在的,高達11%的被保送率跟生涯平均差距很小,讓他的上壘率勉強突破了.340。44個打席依然是個小樣本(或者我們可以說,以這麼生冷未處理的data來說,就算300個打席可能都不太夠),這個小樣本裡有太多干擾因素要解決,就算解決了,這麼短的11場比賽中,打者可能就是那麼剛好狀況不好,不是嗎?為了驗證彭政閔的數據是不是看起來"像是狀況不好",我用了一個最簡易的Hidden Markov model,用2015年整個賽季的資料,以彭政閔單場打擊率0.1、0.2、0.3….1.0,共十個區間作的單場表現打擊率作為離散狀態變數,並且分成四個regime,也就是實況野球體系常用的分類方式,分成極差(哭臉)、正常、狀況好、絕好調四個狀況,讓程式以簡單的Baum-Welch演算法辨識出彭政閔在四個狀況(regime)中變化的機率轉移矩陣,以及各個狀況下他的單場打擊率的間斷機率分佈。2015年辨識的結果大概是這個樣子,橫軸是比賽場次的時間序,縱軸是狀況的高低:我把數值資料標上了各種圖來代表狀況,作成很實況野球的感覺,算是可以直覺地說明了"打者會在某段時間維持某個狀況,會往附近的狀況變化,偶爾會突然大起大落"的現象。用辨識出來的轉移矩陣跟狀態變數的機率分佈,
ATG電子
假設2016跟2015的彭政閔是"同樣的人"為基準下,將今年前11場比賽的狀況辨識出來:對照一下上面2015的圖,就可以知道,在短短10場比賽中有超過一半是不調的狀況,彭政閔的狀況簡直跟2015年最低潮的時候,也就是第61場例行賽之後10場比賽的期間一樣的差。問題在於,"狀況差",到底是什麼?是像"剛剛好就是會打到正面被接到"的運氣嗎?還是體能狀況、注意力集中度?還是對戰的投手剛剛好是比較弱的投手?抑或是主審剛剛好荷爾蒙分泌不順,有些邊邊角角的球硬是要撿,害打者被三振?他這十一場比賽的表現跟去年的連續不調紀錄一樣慘烈,能代表什麼嗎?「狀況」這樣一個詞,實在太含糊不清、太過抽像了,更何況人們若看著數據想要用狀況來說明這個打者只是剛好低潮的作法,也只跟這邊用到的單一狀態變數,嚴重考慮不周的程式沒什麼兩樣。就算這些調整與校準都做到盡善盡美了,確保「這十一場比賽彭政閔真的就是剛好有六場是狀況較差而已」,還有一個真正可怕的問題在等著我們:一個年齡即將邁入38歲,右手有重大傷痛歷史,並且在聯盟過去兩個極端偏打者的年度長打都明顯下滑的選手,我們真的能確定2016的彭政閔,還是2015年的那個彭政閔嗎?他很可能只是一時狀況較差罷了,可是會不會他再也無法跟過去一樣維持「狀況」跟過去一樣,有夠多的好調與絕好調,以便讓成績整個平均拉高到足夠漂亮呢?這都不是看數據、不論是基礎還是進階的數據可以看出來的。如果光看數據就可以知道一切,2002年拿到世界大賽冠軍的就是奧克蘭運動家隊,
雷神之鎚試玩
而不是天使隊了。看著一堆未經處理的數據講個「狀況」就想抓住什麼理由來說明事情,可能說服力都不如彭政閔今年明顯比過去胖的樣子來的有說服力呢*。奇妙的是,同一時間另一位高齡38歲的神級選手陳金鋒,也正在面臨「長達兩年的不調」,對於他不調的說法眾說紛紜,比較多人「支持的理由」是陳金鋒本來就需要固定長期出賽維持手感,這樣上上下下的他本來就會表現不好;不同的是張泰山去年依然繳出勉強可以算是沒有老到透的成績,但也已經是載浮載沉。隨著陳金鋒才開始看球的新一代球迷,過去正好從未經歷過看著一代巨砲衰老、引退的經驗-因為過去讓一代強打謝佳賢、陳致遠這群人消失的原因,是打假球,不是衰老。因為沒有這樣的經驗,所以對於神級選手老了以後,就再也無法像過去一樣「維持狀況」的事情,恐怕並沒有具體的概念,或著就算有這樣的概念,也拒絕接受-大概是因為還想再看陳金鋒、張泰山、彭政閔多打幾年球的關係吧。 註:感謝Sha提醒說明他明顯發福的情況。 ,