回の先頭打者を四球/死球/単打で出塁させたときどれが一番やばいかを調べる
こんにちは。
毎日生きていると、しばしばやばいことが起こりますね。締め切りがやばい、事務仕事を完全に無視してるのでやばい、働きたくないけど働かなければいけないのでやばい、あらいにたばこの匂いがついているのでやばい(海原雄山)、一番うまい刺身は鯖だと言い出すやつがあらわれたのでやばい(海原雄山)、ポン酢のポンとは一体なんなのだ(海原雄山)など。
その中でも一番やばいのは、応援している野球チームの投手が回の先頭打者を塁に出してしまったときだと思います。 今日は、この点についてもう少し詳しく考えてみます。
回の先頭打者の出塁
回の先頭打者を塁に出してしまうとなんとなく得点をとられそうな気がしてやばいと思いますが、その出し方によってなんとなくやばさに違いがないでしょうか。 出塁のしかたとして、主に
- 四球(フォアボール)
- 死球(デッドボール)
- 安打(ヒット)
があると思います。
この中でも、なんとなくやばさの順として、死球 > 四球 > 安打のような感じがしませんか。安打は相手がうまく打てばしょうがないですが、おもむろにマウンドに登場していきなり死球の投手はかなりやばい感じがします。
今日は、上記3種類の出塁のさせ方に対して、平均してその回どれくらいの得点を与えてしまうのかを検証して、やばさの順を決めたいと思います。 ただし、安打は単打に限ります。これにより、出塁後の状況はどれも0アウト・ランナー1塁になるので、原理的には得点の期待値はほぼ同じになるはずです。
計算
pandasでretrosheetのデータを使ってやります。最後にベイズ推定してますが、私はベイズ推定についてもmcmcについても一ミリくらいしか理解してないので勘違いがあるかもしれません。
結果
まずはMLBの1990年から2016年のすべての試合のデータを読み込み、先頭打者を四球・死球・単打で塁に出したイニングの数と、その際に入った得点の平均を出してみます。 以下、計算の詳細については触れないので、知りたい方はコードを見てください。
平均得点 | 回数 | |
---|---|---|
四球 | 0.900 | 81531 |
死球 | 0.931 | 8652 |
単打 | 0.894 | 180476 |
なるほど〜。平均得点にけっこう明確な差が出ましたね。 そのイニングに入る得点としては、死球 > 四球 > 安打の順になっていて、なんとなくの直感的なやばさの感覚と合っている気がします。 といっても、冷静に考えると平均得点の差はそこまで大きくない(0.3点くらい)ので有意な差があるかは微妙です。もう少し詳しく考察してみます。
まず、平均だけでなく得点の分布をヒストグラムで見てみましょう。
先頭打者を四球で出したイニングの得点の分布です。半分以上の確率で無失点で抑えていて、そこから得点が上がるにつれて確率が下がっていますね。
ここでは四球の場合のヒストグラムだけを出していますが、死球や単打の場合も似たようなグラフになるので、違いがよくわかりません。そこで、この得点分布をモデル化してパラメータを比較してみましょう。
確率分布は、確率変数(得点)が非負の整数でなのでポアソン分布でいいでしょう。見た目もポアソン分布っぽくていい感じです(?)。
ポアソン分布は、
というふうにパラメータで表されます。はポアソン分布の平均値でもあるので、が大きいほど、値が大きくなる可能性が高いという感じです。四球・死球・単打から入る得点を表すポアソン分布のをベイズ推定していきましょう。
なるほど〜(BB: 四球, DB: 死球, SH: 単打です(死球は英語ではDeadBallではないですが、日本人なので気にしないでいきます))。
こう見ると、四球と単打のは微妙ですが、死球のは明確に大きいことがわかります(の分布が他の二つとほとんど重なっていません)。すなわち、他の2種類の出塁と比べて、回の先頭打者を死球で出した場合はそのあと得点をとられやすいことがわかりました。
原因として考えられるのは、
あたりだと思いますが、今回はこれ以上詳しくはわかりません。とにかく、死球で先頭打者を出すとその後得点を取られやすいということがわかりました。
結論
回の先頭打者を塁に出すとやばいが、とくに死球の場合がやばく、四球や単打の場合と比べてその回取られる得点が高いです。四球と単打だと、若干四球の方がやばい可能性が高い。
以上、よろしくお願いします。