v3.0
2026-05-18
NPB予想モデル v3.0 方法論
WINSportsAI が公開する NPB (日本プロ野球) 勝敗予想モデルの数式・特徴量・データソース・限界を完全公開します。
📌 透明性ポリシー: 「100% 当たる AI」ではありません。本ドキュメントはモデルの仕組み・前提・限界をオープンにすることで、ユーザーの皆様に予想結果を健全に活用していただくためのものです。
1. モデル概要
WINSportsAI v3.0 は、5つの独立した特徴量を線形に統合した Elo ベースの NPB 勝敗予想モデルです。
team_strength = base_Elo
+ home_advantage
+ starter_pitcher_adjustment
+ bullpen_adjustment
+ park_factor_boost
+ league_correction
P(home_win) = 1 / (1 + 10^(-(strength_home - strength_away) / 400))
1.1 各コンポーネントの寄与
| 特徴量 | Eloポイント幅 | 根拠 |
| base_Elo (勝率) | ±200 | シーズン累計勝率を 1500 ± 400(勝率0-1) でElo化 |
| home_advantage | +28 | NPB 2014-2025 実測 ホーム勝率約54% |
| starter_pitcher | ±30 per 1.0 ERA | FiveThirtyEight MLB Elo 拡張版を準拠 |
| bullpen | ±15 per 1.0 ERA | 終盤救援陣の影響を係数小さめに |
| park_factor | ±10〜±50 | 5年回帰パークファクター (Run PF) |
| league_correction (CL/PL) | ±25 | 2025年交流戦パ20勝差を反映 |
2. データソース
2.1 公式統計データ
2.2 リアルタイム更新
- NPB公式: 日次バッチで取得 (試合終了後 2 時間以内に反映)
- baseball-data.com: 投手成績は週次更新
- パークファクター: シーズン開始前の年次更新 + 5年回帰
3. パークファクター詳細
球場特性は試合結果に大きく影響します。当社モデルは以下の Run Park Factor を採用しています:
| 球場 | Run PF | 性質 |
| 神宮 (ヤクルト) | 1.08 | 打高 (風影響、HR1.4倍) |
| 東京ドーム (巨人) | 1.05 | 打高 (HR出やすい) |
| 横浜 (DeNA) | 1.05 | 打高傾向 |
| マツダ (広島) | 1.00 | 中立 |
| 楽天モバイル | 1.00 | 中立 |
| エスコンF (日ハム) | 1.02 | やや打高 |
| 京セラ (オリックス) | 0.95 | やや投高 |
| みずほPayPay (SB) | 0.97 | やや投高 |
| ZOZOマリン (ロッテ) | 0.95 | 投高 (風影響) |
| ベルーナドーム (西武) | 0.98 | 中立寄り投高 |
| 甲子園 (阪神) | 0.92 | 投高 (HR 0.7倍) |
| バンテリンD (中日) | 0.85 | 極投高 (HR 0.5倍) |
4. 先発投手調整の仕組み
先発投手は単一試合で最も影響の大きい変数です。FiveThirtyEight MLB Elo の手法を踏襲し、リーグ平均ERAとの差分をEloに加減算します。
starter_adj_Elo = (lg_avg_ERA - starter_ERA) × 30
例:
- リーグ平均ERA = 2.64
- 髙橋遥人 (阪神) ERA = 0.38
- 調整値 = (2.64 - 0.38) × 30 = +68 Elo
つまり髙橋登板時、阪神の実質Eloは通常+68の強さに上昇
5. リーグ補正 (交流戦対応)
セ・リーグ (CL) とパ・リーグ (PL) は独立して進化したリーグであり、実力差が存在します。2025年交流戦実績では:
- パ・リーグ: 63勝 (勝率 約59.4%)
- セ・リーグ: 43勝
- 差: 20勝 → 約+25 Elo の PL 優位
CL vs PL の試合では、PL チームに +25 Elo、CL チームに -25 Elo を加減します。同リーグ内試合では補正なし。
6. モデルの限界
⚠️
このモデルが扱えない変数
- 怪我・主力欠場: スポーツ新聞の不確定情報のため未統合 (V4 で LLM 抽出予定)
- 天候: 屋外球場の風速・気温は未統合
- 連戦疲労 / 移動距離: 過去成績の蓄積データなし
- 登板間隔: 中4/中5/中6 の細分化未対応
- 球審バイアス: K%/BB% の球審別データなし
- 新人投手 / 助っ人外国人初登板: サンプル不足で Elo 信頼度低
7. バリデーション
7.1 精度目標
- Straight Up 的中率: 57-61% (NPBブックメーカー終値58-62%相当)
- CLV (Closing Line Value): 正 (市場を継続的に上回る)
- Brier Score: 0.22 以下 (キャリブレ目標)
7.2 検証方法
毎月、全予想試合の Closing Line Value を 結果ログ ページで透明公開します。市場(Pinnacle 終値想定)を継続的に上回るCLVが+であれば、長期的に勝てるモデルと判定します。
8. 更新履歴
v3.0 (2026-05-18)
- 中継ぎ・抑え疲労度 (Bullpen ERA 加重) 追加
- リーグ補正 (CL/PL +25 Elo) 追加
- 5月19日交流戦データ対応
v2.0 (2026-05-18)
- 先発投手FIP (ERA基準) 追加 → 期待+2-3pt
- パークファクター 12球場 追加
- ホームアドバンテージ +35 → +28 (NPB実測整合)
v1.0 (2026-05-18)
- 初版: 勝率→Elo (1500 ± 400) + 固定ホーム+35
9. ソースコード公開予定
モデルの再現性確保のため、コア予測ロジック (Python) を GitHub で公開予定です。データソース・特徴量計算・Elo更新ロジックすべて検証可能な形で提供します。(2026年6月予定)
10. 関連リンク