当サイトは、PRを含む場合があります。

上野竜生です。今回は標準偏差がわかっているときの母平均・母比率の信頼区間を推定します。この場合が1番簡単で,共通テストもここまでは試験範囲です。大学生の期末試験などの場合はこの後に,標準偏差未知の場合や,標準偏差の信頼区間の求め方などを学習する場合もあります。

標本平均・標本比率

POINT母平均m,母標準偏差σの母集団から大きさnの無作為標本を抽出するとき,標本平均の平均はm,標準偏差は\(\displaystyle \frac{\sigma}{\sqrt{n}} \)である。特にnが十分大きいときは正規分布\(\displaystyle N(m, (\frac{\sigma}{\sqrt{n}})^2) \)に従う。

母比率をp,大きさnの無作為標本の標本比率をRとすると標本比率の平均はp,標準偏差は\(\displaystyle \sqrt{\frac{p(1-p)}{n}} \)である。

平均は自明ですが標準偏差が少しややこしいかもしれません。
考え方としては
X,Yが独立のとき
V(X+Y)=V(X)+V(Y)
V(nX)=n2V(X)
が成り立つことを思い出しましょう。
母平均m,母標準偏差σの母集団から大きさnの無作為標本X1,X2,・・・,Xnを抽出するとき
\( V(X_1+X_2+\cdots +X_n )= V(X_1)+V(X_2)+\cdots +V(X_n) = n\sigma^2 \)
\(\displaystyle V(\frac{1}{n}(X_1+\cdots +X_n))=\frac{1}{n^2} (n\sigma^2)=\frac{\sigma^2}{n} \)
となるのでそれのルートをとれば導出できます。
母比率のほうも二項分布での「成功回数(合計)」ではなく「平均(=合計÷n)」の標準偏差なので二項分布の公式の標準偏差をnで割ったものが標本比率の標準偏差になります。

広告

推定・信頼区間

POINT標本の大きさnが十分大きいとき母平均mに対する95%信頼区間は
\(\displaystyle \left[ \bar{X}-1.96\cdot \frac{\sigma}{\sqrt{n}} , \bar{X}+1.96\cdot \frac{\sigma}{\sqrt{n}} \right]\)標本の大きさnが十分大きいとき標本比率をRとすると母比率pに対する95%信頼区間は
\(\displaystyle \left[R-1.96 \sqrt{\frac{R(1-R)}{n}} ,R+1.96 \sqrt{\frac{R(1-R)}{n}} \right]\)※区間の書き方として[a,b]はa≦x≦bを意味します。

1.96という数字は正規分布表をみればわかります。(少し下に正規分布表をはっています)Zが標準正規分布N(0,1)に従うとき,正規分布表を見ると
\( P(0 \leq Z \leq 1.96)=0.4750\)
なので
\( P(|Z| \leq 1.96 )= 0.95 \)
になります。つまり-1.96≦Z≦1.96になる確率が95%なのでこれを95%信頼区間とよんでいます。同様に90%信頼区間や99%信頼区間を求める時も正規分布表で
\( P(|Z| \leq \alpha )= 0.9 , P(|Z| \leq \beta)=0.99 \)
となるα,βを求めれば良いです。(α≒1.64,β≒2.58)
つまり,95%信頼区間の公式の1.96のところを1.64,2.58に変えれば,90%,99%信頼区間の公式になります。
ただ,正規分布表にある数字を使うと1.64や2.58のときはピッタリ90%,99%にはならないのに対し,1.96のときはピッタリ95%になります。なので共通テストでは95%信頼区間が頻出です。

正規分布表

さて,Xが正規分布に従うなら\(\displaystyle Z=\frac{X-平均}{標準偏差}\)が標準正規分布に従うので
\(\displaystyle |Z|\leq 1.96 \)は
平均-1.96×標準偏差≦X≦平均+1.96×標準偏差
とかけます。あとはこれと最初の公式の平均・標準偏差を見比べると信頼区間の公式は理解できると思います。より細かい部分は教科書などで見てください。

例題1

ある工場で生産されているお菓子の重さを100個無作為に抽出すると重さの平均は49.0gであった。重さの母標準偏差を1.0gとするとき1個の重さの信頼度95%の信頼区間を求めよ。(小数第2位を四捨五入して小数第1位まで)
答え公式より
\(\displaystyle \left[49-1.96 \cdot \frac{1.0}{\sqrt{100}} , 49+1.96 \cdot \frac{1.0}{\sqrt{100}} \right] \\ = 49-0.196,49+0.196] \)
四捨五入すると [48.8,49.2]
広告

例題2

ある番組を見たか400人に調査したところ見ていた人は40人であった。
(1)この番組を視聴している人の割合を信頼度95%で推定せよ。また信頼区間の幅を求めよ。(四捨五入せず最後まで求めよ)
(2)信頼区間の幅を(1)の半分にするには,何人に調査すればよいか。
答え(1)\(\displaystyle R=\frac{40}{400}=0.1 \)として公式より
\(\displaystyle \left[ 0.1 -1.96 \cdot \frac{\sqrt{0.1 \cdot 0.9}}{\sqrt{400}} , 0.1 +1.96 \cdot \frac{\sqrt{0.1 \cdot 0.9}}{\sqrt{400}} \right] \\ =\displaystyle \left[0.1 - 1.96 \cdot \frac{0.3}{20} ,0.1 + 1.96 \cdot \frac{0.3}{20} \right] \\ = [0.1-0.0294, 0.1+0.0294 ] = [0.0706, 0.1294] \)
区間の幅は0.1294-0.0706=0.0588
(2)R=0.1なのでn人に調査すると信頼区間は
\(\displaystyle \left[ 0.1 -1.96 \cdot \frac{\sqrt{0.1 \cdot 0.9}}{\sqrt{n}} , 0.1 +1.96 \cdot \frac{\sqrt{0.1 \cdot 0.9}}{\sqrt{n}} \right] \)
となる。その幅は
\(\displaystyle 2\cdot 1.96 \cdot \frac{\sqrt{0.1 \cdot 0.9}}{\sqrt{n}}=\frac{1.176}{\sqrt{n}} \)
これが(1)の半分だから
\(\displaystyle \frac{1.176}{\sqrt{n}}=0.0294 \)
∴\(\sqrt{n}=40 \)
n=1600
1600人に調査すればよい。

この例に限らず信頼区間の幅を半分にするには標本の大きさを4倍にする必要があります。知っておくといいでしょう。

ここまで勉強すると共通テストの数IIBの統計の部分はほぼマスターしたといっていいでしょう。出題傾向が変わらなければ満点も狙えます。

解説を読んで数学がわかった「つもり」になりましたか?数学は読んでいるうちはわかったつもりになりますが演習をこなさないと実力になりません。そのためには問題集で問題を解く練習も必要です。オススメの参考書を厳選しました

<高校数学> <大学数学> さらにオススメの塾、特にオンラインの塾についてまとめてみました。自分一人だけでは自信のない人はこちらも参考にすると成績が上がります。