推定

一部分から全体を推定する話

 

■部分から全体を推測する方法

例えば、成人男性の平均身長を求めるときに

全員を調査するのは時間がかかる。

時間がかかると調査したデータの価値もどんどん

なくなっていく。

なので、一部の人を選び出し全体を推測することが

行われている。

 

■母集団

調査の対象となる者

 

■標本

母集団から取り出される一部のもの

 

・すべてを調査するのが難しい例

1 母集団の数が非常に多い場合

2 缶詰の品質調査のように、母集団はさほど多くないがすべて

調査することが不可能な場合

3 来年の完全失業率のように、未来に起こるため

現時点では調査が不可能な場合

 

■視聴率

テレビの視聴率。

視聴率は全体のテレビ台数のうち対象の番組を見ているテレビの割合。

しかし全てのテレビを調査することは

数が膨大で難しい。まぁ今ならできる気がしないでもない。

 

■標本調査

一部について抜き出して調査すること。

どのぐらい抜き出すかが問題になってくる。

少なすぎず、多すぎずな標本数を導き出す

論理的根拠を示してくれるのが推定です。

 

■標本の数は600

1997年の古いデータだが、

当時の関東の世帯数は1455万世帯となっており、

標本の数は600らしい。少ない。

 

■推定

1455万台のテレビの中から、標本を600台を選び

ある番組Mの視聴状態を調べたところ99台がこの番組を

見ていたとすると視聴率は何%と推定されるか。

1455万台のテレビの中からでたらめに1台を選んだとき

番組Mを見ている事象をAとすると、

この時Aが起きる確率は視聴率pに等しいと考えられる。

そして600台の標本をでたらめに選んだときに事象Aは

独立で確率はpであるとします。

なので600回の独立試行で、事象Aがr回起きる確率といえ、

以下のように表せる。

 

P=(X=r)=600Cr * p^r * (1-p)^(600-r)

 

これは以前学んだ二項分布です。

したがって平均mと標準偏差σは

平均m=600p、標準偏差σ=√600p(1-p) となる。