看板 NBA
標題
Re: [心得] 認識正負值(Plus/Minus)- RAPTOR
作者 IBIZA
時間 2020/05/08 12:16:17
人氣 推:16 噓:1 留言:21
熱門文章不漏接,馬上點此訂閱每日熱門文章通知
訂閱Line日報 熱門文章不漏接,馬上點此訂閱
※ 引述《driftcreator (北美漂流中)》之銘言: 這篇的介紹大概有30%是錯的, 但錯的還蠻關鍵的 : 正負值(+/-)可說是籃球數據界的殿堂名駒,現今你能拿來直接做球員比對的all in one數據,多帶有正負值血統。其血統表如下: : ・第一代「原始數據」:正負值(+/-)、官網RTG系列 RTG不是+/-系列數據, RTG是基於Points Produced的進階數據 : ・第二代「迴歸分析修正」:APM → RAPM : ・第三代「混合傳統數據」:ESPN RPM(2013年版) : ・第四代「混合動態追蹤數據」:ESPN RPM(2019年版)、RAPTOR : 個人當前較推薦使用RAPTOR。邏輯透明且能追朔至2013賽季。 : 新版ESPN RPM因為是黑盒子的關係,所以無從介紹驗證。目前RPM的產出結果,與其他版本(RAPTOR、BPM2.0、PIPM)存在較大的差異性。 ESPN得到RAPM授權之後, 推出了RPM 就RPM的說明, RPM是以RAPM為基底, 加上數據做調整, 但一直沒說明調整的方式 所以上面關於ESPN RPM的說明沒問題 但就RAPTOR的說明, 他並不是和ESPN一樣, 以RAPM為基礎加上數據做調整 而是直接用傳統數據+動態追蹤數據, 透過回歸分析去追蹤RAPM 這一點和BPM的做法類似, RAPTOR在網頁上也直說是由BPM得到靈感 為什麼BPM跟RAPTOR會這樣做? RAPM的模型自從推出後就廣被推崇 但RAPM最大的問題, 就是需要夠大的回合數才能得到有效的數字 這邊的回合數在一開始RAPM的網頁中被定義為20000回合 但其實一整季都打不到這個數字 最操勞的球員都要三季才能得到20000回合數, 遑論有很多球員一輩子可能都達不到 因為RAPM計算不便, 又有短期效度問題 所以就有人嘗試以傳統數據用迴歸分析, 去追蹤長期RAPM 這種做法的想法就是 以長期RAPM作為應變項, 為每個挑出來的數據跑回歸分析, 找出權重 這樣找出來的所有權重*數據之後加起來, 就會近似於長期RAPM 那麼之後我們就可以直接把權重*數據當作長期RAPM 最初是2011年的ASPM ASPM用傳統數據透過回歸分析去追蹤八年(2003-2011)的RAPM數據 ASPM後來授權給BR網站, 因為他是用傳統數據, 也就是Box Stats去追蹤RAPM 所以被取名為BPM RAPTOR則是BPM的新一代版本 RAPTOR在傳統數據之外, 加上了官網在近六年提供的動態追蹤數據 簡單講, ESPN RPM是RPM的混合版本, 他仍然是基於原本的RPM模型, 但加上數據做調整 但BPM跟RAPTOR則是RPM的追蹤版本, 用回歸分析去追蹤某段長時間的RAPM, 以此產生公式 雖然都基於RAPM, 但他們是完全不同的東西 把他們列為不同代的數據是不適合的 要比喻的話 ESPN RPM是RAPM+其他數據生的小孩 而BPM跟RAPTOR則是透過整形把自己整得像某一段時間的RAPM : --- : 使用正負值數據前,你需要有以下基礎認知: : 正負值數據僅呈現「該球員於當前環境的已產出表現」 : a.預設球員表現穩定,不存在定位調整或化學反應。因此季中轉隊球員數據容易失真。 這邊的說明是錯誤的 RAPM並沒有預設球員表現穩定,不存在定位或化學反應 相反的, RAPM利用大數據去分析lineup與lineup的對抗 這是RAPM被推崇的主要原因 但也是RAPM的問題, 因為很多lineup的回合數不足以消除偏差 RAPM知道定位跟化學反應的影響, 嘗試用大數據去分析lineup的影響 你可以說他受限於數據做的不夠好, 但不能說他沒這樣做 : b.這類數據對未來的預測性低。只要隔季所待球隊環境改變,數據就很容易大變。 : 新一代數據的準確度,與位在高樓大廈內的GPS定位差不多 : a.注意概略落點即可,不要太執著在排名與微小的數字差異上。 : b.原始+/-與官網RTG系列評估球員的精準度非常差,不要拿來用。 : --- : FiveThirtyEight RAPTOR : https://projects.fivethirtyeight.com/2020-nba-player-ratings/ : a.加入了Second Spectrum的動態追蹤數據;能向前追朔至2013賽季。 : b.由85% BPM與21% RAPM組成,且有公開細部的權重分配。 這邊錯了, 網頁上85%跟21%指的是Total RAPTOR=85% BOX RAPTOR+21% On/Off RAPTOR 跟BPM和RAPM無關 : c.邊緣輪替球員(replacement level)的基準值:-2.75。 : d.有「球員未來預期版」,並額外添加了一堆參數進去。 : --- : 以上是基於ptt閱聽眾特性的精簡版本。以下是解析文字較多的太長不看版 : https://vocus.cc/basketball/5dc88173fd8978000153fb0e : 關於數據,Playtype與USG%則是球迷間最容易濫用與錯誤解讀的。相關介紹如下 : 認識Playtype : https://vocus.cc/basketball/5d967bc0fd89780001a485ed : 認識USG% : https://vocus.cc/basketball/5dc88151fd8978000153fb01 -- 願歲月靜好,現世安穩 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.56.77 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/NBA/M.1588911379.A.7B1.html
Vedan: 推 05/08 12:24
Nogone: 推 05/08 12:26
jonestem: 推 05/08 12:28
lens82801: 推 05/08 12:29
pneumo: 推 05/08 12:33
※ 編輯: IBIZA (122.116.56.77 臺灣), 05/08/2020 12:53:34
FAYeeeeeeee: 我覺得搞懂這個比搞懂CBA還麻煩 05/08 12:59
jonathan8907: 推 05/08 13:30
s891234: 推 05/08 13:32
dda: 推 05/08 13:37
Kenshin0707: 有資料有推 05/08 13:58
Altair: 推詳細說明與比較 05/08 14:35
Altair: CBA有時候需要的是時空背景的理解 05/08 14:35
Altair: 而這種通常需要的是對分析假設及統計方法的理解 05/08 14:36
tanp23lj: I大接受專業 05/08 14:44
Ten6666: 先推 05/08 15:39
KirkSynder: 專業文推,專業到沒幾個人看得懂 05/08 20:24
AmibaGelos: 推推 好奇如果拿短期球員的raptor去喂rapm會如何xd 05/08 21:00
AmibaGelos: 如果短期和長期沒有系統偏差的話應該會有幫助? 05/08 21:00
deanisme: 原來raptor也是box metrics的產物 一直覺得這種類 05/08 22:52
deanisme: 型的數據 其命名裡面根本不該有+/- 05/08 22:52
ckain: 扯 12/04 05:37
近期熱門文章
NBA 看板熱門文章