統計学の用語編

人のために書くというよりは、自分の理解のためなので

わかりにくいかもしれないけど、箇条書きとかメモっぽい書き方で

一度書いてみます。いろいろ試します。。

 

■階級

使ってはいるが、こういう言葉だったのかという感じ

ある数値ごとに区切るときの値。

例えば給与が10万、20万、20万、30万、35万の人がいるときに

10万ずつの階級に区切って考えましょうという話

 

■度数

階級に属するデータの数。

上記の話でいうと、10万が1、20万が2、30万が2ということ

 

■相対度数

それぞれの階級の度数を度数の合計で割った値。

パーセンテージということなんですかね

上記の話でいうと10万が0.2 20万が0.4 30万が0.4

 

■度数分布表

階級と度数を表にしたもの

 

■階級の幅

例えば5万以上15万未満のようなA以上B未満で区切った階級について、

AとBの差であるA-Bを階級の差という。

多分使わない。会話の中で「これの階級の幅って問題ないかな?」

というとデキる感じを出せるかもしれないぐらい。

5万以上15万未満の階級の幅は10万

今回だと10万ごとにデータを区切っているので

0-10万、10万-20万、20万-30万となり

階級の幅は10万です。

 

階級の幅はデータ似合わせて取るべき。

上記の例で階級の幅を100万にすると度数は0から100万の部分だけに

存在しよくわからないデータになる。

階級の幅を5万にすると度数が0な階級が増えて

ヒストグラムにすると見にくい。

 

■階級値

各階級の最大値と最小値の合計を2で割ったもの

5万以上15万未満の階級であれば15+5/2=10万

 

ヒストグラム

またの名を柱状グラフ

文章で表すのは難しいですが、

階級に対して度数を棒の長さで表すあれです。

 

■代表値

あるデータを代表する値、

平均値、中央値、最頻値など。

 

メジアン(中央値)

 

これは知ってた。データが奇数の場合は数値を順に並べたときの

真ん中の値、偶数の場合は真ん中の2つの値の平均値

この偶数と奇数の定義の違いはあまり重要ではない感じはしている

定義の問題。平均給与で飛びついて入社して中央値で絶望する

みたいなときに使えるワード

 

■モード(最頻値)

並み値ともいうらしい。

もっとも度数が多い階級値。

 

こういう書き方だと書きやすくていいですね。

今後もこの感じで進めていきたいと思います。