
中央値と加重平均の違いを徹底解説!どちらがデータ分析に適しているのか?
データ分析をする際に、よく目にする統計値があります。それは「中央値」と「加重平均」です。しかし、これらはそれぞれどのように異なるのでしょうか?中学生でもわかりやすく解説していきます。
中央値とは?
中央値は、データを小さい順に並べたときに、真ん中に来る値のことを指します。例えば、データが {2, 4, 6, 8, 10} だとすると、中央値は 6 です。ただし、データの数が偶数の場合は、真ん中の2つの値の平均を取ります。例えば、データが {1, 3, 7, 9} の場合、中央値は (3 + 7) / 2 = 5 になります。
加重平均とは?
加重平均は、各データに重みを付けて計算される平均値です。例えば、試験の成績で、定期試験が80点、実技試験が40点とし、それぞれの重みが定期試験: 0.7、実技試験: 0.3の場合、加重平均は以下のように計算します。
加重平均 = (80 × 0.7 + 40 × 0.3) / (0.7 + 0.3) = (56 + 12) / 1 = 68
中央値と加重平均の違い
項目 | 中央値 | 加重平均 |
---|---|---|
定義 | データの真ん中の値 | 重みを考慮した平均値 |
計算方法 | データを並べ替え、中間値を求める | 各データ×その重みの合計を、重みの合計で割る |
データ数が偶数の場合 | 真ん中の2つの値の平均を取る | 重みが大きいデータが結果に大きく影響 |
まとめ
中央値と加重平均は、それぞれ異なる目的で使い分けられます。中央値はデータのばらつきに影響されにくく、加重平均は重要度を考慮したい場合に適しています。したがって、データ分析を行う際には目的に応じた統計手法を選ぶことが重要です。
中央値はデータのばらつきに強い影響を受けませんが、例えば収入データのように極端な数値がある場合、中央値の方が一般的な感覚に近いことがあります
これに対し、加重平均は特定のデータに重みを持たせて計算しますが、重みを設定する際にはその変数が偏るリスクも考慮しなければなりません
実際、データ分析のシナリオでは、どちらの方法が適しているか慎重に判断することが求められます
次の記事: 平均と最頻値の違いを徹底解説!どちらを使うべき? »