ヒストグラム範囲の決め方
ナビゲーションに移動
検索に移動
ヒストグラム範囲の決め方
[統計]
範囲の決め方
- データの数nを求める。度数分布表を作るにはnは少なくとも50、できれば100以上必要である。
- データを大きさの順に並べる。
- 範囲Rを求める。データの中から最大値maxと最小値minをみつけ、範囲を計算する。 R=max-min
- 階級間隔hを決める。範囲Rを10~20の適当な数で割る(この商をkとする)。階級間隔を測定値の測定単位の整数倍とするためにkを整数値になるように丸める。このときデータ数が100より少ないときはkを大きめの値に丸め、100以上のときはkを小さめの値に丸める。
- 階級分けの出発点を決める。最初の階級は最小値を含み、階級間隔hであり、次の階級との境界値は共通し、しかもデータが2階級にまたがらないように、決めなければならない。そのため、最小値から測定単位の2分の1を引いた値を階級の出発点とするとよい。(こうすると階級の境界値は測定単位の整数倍プラス測定単位の2分の1となり、境界値にデータが重なることはなくなる。)
- 出発点の値に階級間隔hを逐次加え、最大値を含む階級までの境界値を決定する。
- 度数分布表を作成する。各階級の中央の値をその階級の階級値とする。
- 次にヒストグラムを作成する。横軸に階級の境界値を取る。
- 縦軸に度数を目盛る。このとき、できる図形の縦・横の比が2:3程度になるのがよい。
© 2006 矢木浩人