当サイトは、PRを含む場合があります。

上野竜生です。今回は正規分布というものを理解し,正規分布表を読んで問題が解けるようにすること,二項分布を正規分布に近似して問題を解けるようにする部分を扱います。ここまでできれば共通テストの統計部分の半分は終わったといってもいいでしょう。また,大学生にとってもほぼ確実にここは試験に出ます。

正規分布

確率変数Xの確率密度関数f(x)が\(\displaystyle f(x)=\frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-m)^2}{2\sigma ^2}}\)
(σ>0)で与えられるときXは正規分布N(m,σ2)に従うという。
y=f(x)のグラフは下の通り

正規分布

重要なのはx=mについて対称であることと,x=m付近は大きな値でそこから離れるとどんどん小さくなるということです。
正規分布N(m,σ2)の平均と分散の計算は定義に従えば複雑な積分計算となるが,結果はシンプルで
平均E(X)=m,分散V(X)=σ2,つまり標準偏差=σ
となる。これらは定義から毎回積分計算するのではなく結果を覚えておくこと。

正規分布の中で特に平均0,標準偏差1のもの(つまりN(0,1))を標準正規分布という。

正規分布で興味があるのはP(a≦X≦b)となる確率である。
定義に従って計算すると積分\(\displaystyle \int_a^b \frac{1}{\sqrt{2\pi} \sigma} e^{-\frac{(x-m)^2}{2\sigma ^2}}dx \)をして上の赤い部分の面積を求めればよい。ただし,正規分布の密度関数f(x)は複雑なので不定積分を求めることができない。そこで正規分布表を用いて近似値を求める。

広告

正規分布表

正規分布表

正規分布表では標準正規分布N(0,1)の場合の図の灰色の部分の面積がいくらなのか近似値が書かれている。
縦に小数第1位まで,横に小数第2位がかかれているので
たとえばP(0≦X≦0.12)は0.1の行の0.02の列にある数字を見ると0.0478だからP(0≦X≦0.12)=0.0478と求めることができる。

与えられるのは標準正規分布の場合だけであるが,標準とは限らない正規分布の場合も実は標準正規分布表から簡単に求められる。正規分布には次の性質がある:

POINTXが正規分布N(m,σ)に従うとき,\(\displaystyle Z=\frac{X-m}{\sigma} \)と変数変換するとZは標準正規分布になる。

証明は省略するがこれは非常によく使うので(共通テストでも大学の期末試験でも)結果だけ覚えて使いこなせるようにすること。

例題1

正規分布表を見て答えよ。
(1)Xが正規分布N(0,1)に従うとき次の確率はいくらか?
(i)P(X≧0.82)
(ii)P(-1≦X≦2.5)
(iii)P(|X-0.05|≦0.08)
(2)Xが正規分布N(30,42)に従うときP(32≦X≦37)を求めよ。
答え(1)(i)0.8の行の0.02の列を見ればP(0≦X≦0.82)=0.2939
対称性からP(X≧0)=0.5なので
P(X≧0.82)=P(X≧0)-P(0≦X≦0.82)=0.2061

連続型の場合はイコールになることは無視してもよい。
つまり,厳密にはP(X≧0)-P(0≦X≦0.82)=P(X>0.82)
となるがP(X=0.82)=0としてよく,
P(X≧0.82)=P(X>0.82)として考える

(ii)P(-1≦X≦2.5)=P(-1≦X≦0)+P(0≦X≦2.5)
=P(0≦X≦1)+P(0≦X≦2.5)
=0.3413+0.4938=0.8351
(iii)P(|X-0.05|≦0.08)=P(-0.03≦X≦0.13)
=P(0≦X≦0.03)+P(0≦X≦0.13)
=0.0120+0.0517=0.0637
(2)\( \displaystyle Z=\frac{X-30}{4} \)とおくとZは標準正規分布に従う。よって
\(\displaystyle P(32 \leq X \leq 37) \\ \displaystyle = P(\frac{32-30}{4} \leq \frac{X-30}{4} \leq \frac{37-30}{4}) \\= P(0.5 \leq Z \leq 1.75) \\ = P(0\leq Z \leq 1.75)- P(0\leq Z \leq 0.5)\\ = 0.4599-0.1915 = 0.2684 \)

広告

例題2

ある高校の生徒400人の身長Xが平均171.1cm,標準偏差5.2cmの正規分布に従うとする。
(1)身長175cm以上の生徒は約何人いるか
(2)身長が高い方から10人の中に入るには身長が何cm以上あればいいか。
答え(1)\( \displaystyle Z=\frac{X-171.1}{5.2} \)とおくとZは標準正規分布に従う。
\(\displaystyle P(X\geq 175)= P(Z \geq \frac{175-171.1}{5.2})=P(Z\geq 0.75)\\ = 0.5-P(0\leq Z \leq 0.75)=0.5-0.2734=0.2266 \)
400×0.2266=90.64
約91人
(2)400人中10人だから上位\(\frac{10}{400}=0.025 \)までに入る必要がある。
つまりP(Z≧α)=0.025となるαを求める。
P(Z≧α)=0.5-P(0≦Z≦α)なので
P(0≦Z≦α)=0.475
正規分布表からαを求めるとα=1.96
\(\displaystyle Z=\frac{X-171.1}{5.2}=1.96 \)なので
\( X=171.1+5.2\cdot 1.96=181.292\)
181.3cm以上であればよい

二項分布と正規分布

二項分布B(n,p)は平均np,標準偏差\(\sqrt{npq}=\sqrt{np(1-p)} \)であった。
nが十分大きいときは平均np,標準偏差\(\sqrt{npq}=\sqrt{np(1-p)} \)の正規分布に従うと近似できる。

厳密にはイコールではないので誤解を避けるため,共通テストでは必ず「○○(たとえば100)は十分大きいので正規分布に近似できる」などと宣言されています。もともと二項分布の性質で解いていたとしても,その宣言以降は正規分布の性質から答える問題になります。なのでこの性質を暗記するほどではありません。

例題3

5択クイズ400問をすべてランダムに答えるとき,正解数が100問以上になる確率を求めよ。
答え正解数をXとする。正解数の平均は\( 400\cdot \frac{1}{5}=80\),分散は\( 400\cdot \frac{1}{5} \cdot \frac{4}{5} =64 \),標準偏差は8である。
よって\(\displaystyle Z=\frac{X-80}{8} \)とおくとこれは近似的に正規分布N(0,1)に従うので
\(\displaystyle P(Z \geq \frac{100-80}{8})=P(Z\geq 2.5)\\ =0.5-0.4938 = 0.0062 \)

ここから分かる通り5択クイズなので適当に答えても平均20%は正解できるはずです。25%正解しても誤差の範囲かと思いきや,実は上位0.62%の超ラッキーな場合しか起こらないことなのです。今後は上位2.5%or下位2.5%の特殊パターンがどの範囲にあるのかということを求めていきます。逆にその特殊パターン以外の95%の区間を求めると意外とその幅は広くないことがわかっていきます。ぱっと見は誤差に見えてもそれが本当に誤差の範囲(95%の狭い区間内)なのか,特殊なことが起きているのかを見極める指標として使われます。

今回紹介した正規分布表の読み取りは統計のテストではほぼ100%出題されるメインテーマになります。必ずできるようにしましょう。

解説を読んで数学がわかった「つもり」になりましたか?数学は読んでいるうちはわかったつもりになりますが演習をこなさないと実力になりません。そのためには問題集で問題を解く練習も必要です。オススメの参考書を厳選しました

<高校数学> <大学数学> さらにオススメの塾、特にオンラインの塾についてまとめてみました。自分一人だけでは自信のない人はこちらも参考にすると成績が上がります。