2019年大聯盟棒球比賽
分析期程 : 自 4 月 7 日(起)至 10 月 30 日(止)
分析場數 : 2289 場次
勝負統計 : 客勝 1082 場次(勝率 47.3%),主勝 1207 場次(勝率 52.7%)
主場優勢 : 5.4%
勝負分統計 :
客勝 =1 分 : 238 場次 (占比 10.4%)
客勝 >1 分 : 844 場次 (占比 36.9%)
主勝 =1 分 : 369 場次 (占比 16.1%)
主勝 >1 分 : 838 場次 (占比 36.6%)
=1分差比賽 :  607 場次 (占比 26.5%)
>1分差比賽 : 1682 場次 (占比 73.5%)
--------------------------------------------------------
測試說明 :
預測模式 : 總共 5 種預測模式.(模擬 1 種,深度學習 4 種)
優選模式 : 2019年新開發出 1 種優選模式,將從各模式的預測中,選出最可能的結果.
預測目標 : 準確度 60%以上(每天 15 場比賽,至少 9 場正確),
此為經計算賠率(1.8)與合牌後,最低達到損益平衡之要求.
莊家賠率 : 目前莊家或各專業人士的預測水準,平均最高僅為 58%,
因此經賠率設定後,莊家仍是最後贏家,
再則台灣運彩將稅率內含後,賠率則較國際更低,對玩家越不利.
故買台灣運彩的準確度要求至少 67%(每天 15 場比賽,至少 10 場正確)
-----------------------------------------------------------------------
內容(2019/12/26加入)
測試結果 :
1.比賽模擬模式
預測正確場數 : 客勝 607 場次 , 主勝 656 場次 , 預測準確度 55.2%.
 
2.分數分布之深度學習模式
預測正確場數 : 客勝 371 場次 , 主勝 917 場次 , 預測準確度 58.6%.
 
3.分數分布與各局分數之深度學習模式
預測正確場數 : 客勝 586 場次 , 主勝 685 場次 , 預測準確度 55.5%.
 
4.各局分數之深度學習模式
預測正確場數 : 客勝 533 場次 , 主勝 766 場次 , 預測準確度 56.7%.
 
5.部分反轉之深度學習模式
預測正確場數 : 客勝 503 場次 , 主勝 702 場次 , 預測準確度 52.6%.
 
綜合說明 :
根據 2019 年 2289 場次的賽前(已知先發投手)客主隊的勝負預測準確度約為 58% ,
賽後(已知 1~9 棒次及各後援投手)客主隊的勝負預測準確度約為 68% ,
顯示 , 如果賽前能準確地預估各隊出場棒次及後援投手之名單 , 可以提升約 10%的準確度.
再則 , 統計預測錯誤率 , 比賽約有 30% 的意外(指球員超出其原有水準數據 , 該場表現可能為更佳或更差) ,
 
綜合結論 :
1. 此意謂著不可能僅由球員數據就能準確預測出比賽的勝負 , 根據後驗預測 ,
   僅以數據評估比賽的勝負結果 , 最高的準確度(平均)上限約為 70%.
2. 根據後驗預測的準確度 , 本模擬程式的投打對決函式(各類修正參數)是達到可供參考的水準.
 
綜合討論 :
1. 是否可以將各類預測模型(客主勝負之機率值)以監督式學習(實際比賽結果) ,
   訓練出優選模式(用以從各類模型中選取出最可能的預測結果) , 藉以突破預測準確度的障礙 , 超越至 70%以上.
2. 前述優選模式已於 2019 年底開發完成 , 隨機取 2019 年 2289 場次之 80% 場次進行深度學習神經網路訓練 ,
   另 20% 場次則用來驗證此模式的準確度 , 經測試此優選模式可達 90% 以上的準確度.
   結果驚人 , 但仍須於 2020 年進行驗證 , 才能得到最後的結論.
3. 預估 2020 年的優選模式可以達到至少 70%以上的準確度 , 甚至期望到 80%.
-----------------------------------------------------------------
new-優選之深度學習模式(介紹),持續更新中,請期待!
 
2020/01/19新增以下
此統計表為2018年及2019年各模式準確度統計,相關數據說明再持續更新!

模式統計.png

 
 
----------------------------------------------------------------------
2019年的後驗預測準確度約 67 %
(後驗預測,指以賽後之實際1~9棒及後援投手進行模擬 , 另在賽前的預測,則僅知先發投手名單,其餘出場球員為可能性預判)

fig-1008.png

2018年的後驗預測準確度約為67%

(後驗預測,指以賽後之實際1~9棒及後援投手進行模擬 , 另在賽前的預測,則僅知先發投手名單,其餘出場球員為可能性預判)

fig-2018.png

 
 
------------------------------------------------------------------------

有網友問到程式的問題,因此,再次公開說明,讓更多有興趣的網友一起討論.

因為必須每天下午去下載最新的大聯盟網站的各項球員資料,然而球員資料網頁可以點選但是沒有可以一次完全下載,所有30隊每隊40人的球員資料有上千人,不可能人工下載,因此,我是已經將下載的工作以程式完成.作業方式如下:
1.下載所有球員數據 (程式進行)
2.選擇每隊的先發投手與打擊順序 (人工選取)
3.輸入運彩場次與對戰隊伍 (人工設定)
4.跑模擬程式並輸出各5千次的對戰模擬每局分數 (程式進行)
5.各場次存檔並統計分析 (人工與程式同時進行)

所有程式都是有EXCEL VBA 開發完成!但是目前仍要在EXCEL底下運作,程式都還是研究階段,因此,還有可能修改,所以未編譯成獨立的執行程式碼!

 

注意:

本程式自2019年起為優化程式及增加動態網頁爬取功能,已採 python 重新編寫程式 , 新增功能有:

1. 可以依照日期下載球員數據

2.彙整每日比賽結果

3.程式比對預測及實際比賽結果 , 驗證修正函數的準確度

4.自動編排每個球隊 1 ~ 9 棒球員及出戰投手(先發投手下載 MLB官網公布,另預測中繼,長中繼,工具人及終結者)

5.預測模擬

6.新增深度學習神經網路 , 以預測模擬數據及實際比賽後結果 , 訓練模型參數.

7.每日將訓練後的神經網路優化各比賽的勝負預測.

-------------對有興趣者

 

arrow
arrow
    全站熱搜

    cozypotter 發表在 痞客邦 留言(6) 人氣()