理系大学生の日記

考えたこと、調べたことを気ままに書いています。分かりやすく、読みやすい記事を心がけています。

一軍でヒットを打った選手は何人?【前編】

今までプロ野球の一軍でヒットを打った選手は何人か、「べき乗則」と呼ばれる簡単なモデルを使って推定していきたいと思います。(前編です。後編はこちらです。)

目 次

 

2019年に一軍でヒットを打った選手のデータ

はじめに、2019年に一軍でヒットを打った選手全員のヒット数を入手し、次の3つのグループに分け、それぞれについて「ヒット数と順位(昇順)の間に成り立つ関係」を見出すことにしました。

(順位には「同率」が生じないようにしました。例えば165安打で同率10位の選手が3人いた場合は、それぞれ10位、11位、12位と分けました。)
これらのグループについて考察することにした根拠は、これらのデータをプロ野球の全ての選手の記録を小さく分けた「縮図」と捉えることができると考えたからです。そして、そう考えたのは以下の事実から単年のデータを積み上げることが妥当だと考えたからです。

  • あらゆる年齢層の選手(新人からベテランまで)のデータが揃っている。
  • 起用法(スタメンや控えなど)が異なる選手のデータが混ざっている。
  • コンディションは選手や時期によって十人十色である。

単年のデータを積み上げることで、全体の様子を推定できるはずです。ヒットの数や順位は積み上げによって大きくなっていきますが、それらの相関関係には影響がないという仮定をしたということです。

では、3つのグループについてのグラフを見てみましょう。(2019年度セ・リーグ打撃個人成績 安打数ランキング2019年度セ・リーグ打撃個人成績 安打数ランキングにあったデータを使用しました。)

f:id:eagles_22:20191004175237p:plain

f:id:eagles_22:20191004175245p:plain

f:id:eagles_22:20191004180305p:plain

は各選手の順位(x軸)とヒット数(y軸)の組み合わせをブロットしたもので、直線はxとyの間にべき乗則が成り立つ、すなわち
 f:id:eagles_22:20191004180725p:plain
が成り立つと仮定し、最小二乗法で求めたものです。x軸は対数目盛です。

f:id:eagles_22:20191004181142p:plainは決定係数と呼ばれる数値で、1に近いほど  の分布と直線の形状が似ているという意味になります。つまりf:id:eagles_22:20191004181142p:plainが1に近いほど「べき乗則」に従うということになります。3つのグループ全てについて0.99程度なので、ヒット数と順位の間にはべき乗則が成り立つことになるはずです。

ですから、「単年の積み上げであるプロ野球の今までの通算成績もべき乗則に従う」という仮定ができます

 

なぜセ・パで分けたか?

パ・リーグはDH制を導入していますが、セ・リーグは導入していません。DH制の有無に関係なくべき乗則が成り立つことを示すためにセ・パそれぞれのグラフを示しました。また、セ・パをまとめたグラフからもべき乗則が成り立つことが分かりますよね。

 

まとめ

  • 単年の成績は、通算成績の「縮図」であると考えた!
  • DH制の有無に関係なくべき乗則」が成り立つ
  • 通算成績についてもべき乗則」が成り立つ

 

関連記事

sluggerblog.hatenablog.com