論文を読んでいたり、研究をしていると必ず以下の言葉をよく目にしますね。
・平均値(mean)
・中央値(median)
・標準偏差(Standerd Deviation: SD)
・四分位範囲(Inter Quartile Range: IQR)
この言葉の使い分け、皆さんわかりますか?
平均値は、皆さんもご存知の通り、全体の平均の値を指します。
では、中央値は?というと、その言葉の通り、中央の値を示しています。
例えば、体重のデータが、
55.6/78.8/63.2/66.5/85.6/72.5/52.5
とあったとします。
このデータを小さい順に並び替え、その中央の値が“中央値”です。
つまり、上記の体重のデータの中央値は
52.5/55.6/63.2/66.5/72.5/78.8/85.6
↑
となるため、66.5が中央値となります。
では、どちらを使うのか?
それは、データが正規分布かどうかを確認する必要があります。
・正規分布の場合→平均値(中央値)
・非正規分布の場合→中央値
となります。
今回はここまでにして、次回は標準偏差(SD)、四分位範囲(IQR)を図を使いながら、説明していきたいと思います。