3-4

・平均値は真実を捉える理由

 

因果関係の洞察という観点で平均値の方が中央値より関心のあることに

対する直接的な答えとなっていることが多い。

多くの場合何らかの結果を示す結果を示す値の総量を最大化したい

ということに向けられるが

それに対して中央値はその答えを与えない。

 

例えば、駄菓子屋で2100円の買い物をする人一人と

300円の買い物をする人が8人いるとして

何とか売り上げを上げれないかということで

1000円ごとに引けるくじを用意したところ

300円の人は購入金額は変わらなかったが

2100円の人は3000円の売り上げになった。

この場合中央値は300円と変わらないが

売り上げとしては900円増加しており、

平均値600円で100円上昇している。

 

要するにデータの現象把握として適切だろうとなかろうと

一部の極端な人間のみに集中していようと

全体として売り上げがいくら変わるのかという総量の

増減を示すには平均値の方が適しているということである。

 

また、そうした実用上の問題だけでなく、なぜ平均値をバラつきのあるデータ

の背後にある真の値と考えると良いのか。

データのバラつき方が正規分布に従っているのであれば

最小二乗法が最も良い推定方法であり、

その結果、平均値が最も良い推定値となる。