データ全体の中心を表す代表値(合計÷個数)
平均(mean)とは、データ全体の中心を一つの数値で表す代表値です。もっとも一般的なのは算術平均で、合計 ÷ 個数 で求めます。テストの平均点、月の平均気温、商品の平均価格など、私たちの周りには平均があふれています。
μ = (x₁ + x₂ + … + xₙ) / n
身近な例として、5教科のテストの点数が 60, 70, 80, 50, 90 点だったときの平均は (60+70+80+50+90) ÷ 5 = 70 点。データ全体を「真ん中で支えるバランス点」とも言えます。シーソーのように、各値が平均から離れた距離の合計(プラスとマイナス)はちょうど打ち消し合います。
合計/個数 で求められる平均は、「すべてのデータが同じ値だったら何になるか」を表す指標だと理解しておくと、応用的な場面でも考えやすくなります。
平均には用途に応じた3つの代表的な種類があります。それぞれ向いている対象が違うので、データの性質によって使い分けます。
| 種類 | 式 | 用途 |
|---|---|---|
| 算術平均 | Σx / n | テストの点数、気温など足し算で意味のある量 |
| 幾何平均 | (Πx)^(1/n) | 成長率・利率・倍率など掛け算で繋がる量 |
| 調和平均 | n / Σ(1/x) | 速度・密度など分母に意味のある比率 |
具体例:行きと帰りの平均速度 行き 60km/h、帰り 40km/h で同じ距離を移動したとき、平均速度は 算術平均の 50km/h ではなく、調和平均の 48km/h になります。速度(km/h)は「時間あたりの距離」なので、足して 2 で割るのは意味がありません。
具体例:年利の平均 1年目 +20%、2年目 +0%、3年目 −10% の運用成績の「平均年利」は、足し算で出した 3.3% ではなく、幾何平均で求めるのが正しいのです(複利は掛け算で増えるため)。
3 つの平均の大小関係は、正の値で一般に 調和平均 ≤ 幾何平均 ≤ 算術平均(すべて等しいときに等号が成り立つ)となります。算術平均との違いを意識すると、それぞれの使いどころが見えてきます。
相加平均(=日常で「平均」と呼ぶもの)の計算手順はシンプルです。
・ステップ①: すべての値を足して合計を求める
・ステップ②: 合計を個数 n で割る
・結果が「全員が同じ値だったとしたら何になるか」を表す
加重平均(かじゅうへいきん)とは、値ごとに重み(重要度・割合)をかけてから平均を求める方法です。たとえば国語・数学・英語のテストに重み 2:1:1 をつける場合、国語の点数は2倍にカウントします。
計算例(国語 80、数学 60、英語 70 / 重み 2:1:1)
(80×2 + 60×1 + 70×1) ÷ (2+1+1) = 290 ÷ 4 = 72.5
なぜ重みをつけるのか。普通の平均は「全科目が同じ重要度」と仮定しています。でも大学入試などでは「英語を2倍重視する」など科目ごとに重要度が違います。このとき単純に足して割ると、重要な科目の影響が薄れてしまいます。重みをかけることで重要度の差を正しく反映した平均が求められます。
平均は「合計 ÷ 個数」なので、合計に直接影響するあらゆる値が平均を動かします。外れ値(=極端に大きい・小さい値)が1つ入ると合計がガクッと変わり、個数が少ないほどその影響が大きくなります。
上の例では 200 という1つの外れ値が合計を 300 から 430 に増やし、平均を 60 から 86 へ押し上げています。実際の 4 人は 50〜65 点の範囲にいるのに、平均は 86 となり実態を映せていません。
中央値(メディアン=データを並べた真ん中の値)は合計を使わないので、外れ値の影響を受けません。同じデータ(50, 55, 60, 65, 200)の中央値は 60(3番目の値)のまま動かないことで確認できます。
・平均:計算に全データが関与する → 外れ値に弱い
・中央値:真ん中の順位だけ見る → 外れ値に強い
算術平均の弱点は外れ値(異常に大きい・小さい値)に弱いこと。1 つでも極端な値が混ざると、平均が大きく引きずられてしまいます。
具体例:年収 9 人の年収が 400〜600 万円、ただ 1 人だけ 10 億円の経営者がいる職場の「平均年収」を計算すると、約 1 億円超になってしまいます。多くの人の実感(500 万円前後)からは大きくズレた数字です。これが外れ値による平均の歪み。
上のツールで「+ 外れ値を追加」ボタンを押してみると、平均ラインが大きく右にずれることが確認できます。
対策
・中央値(メディアン):データを並べた真ん中の値。外れ値の影響を受けにくい
・最頻値(モード):もっとも頻繁に出る値
・トリム平均:上下数%を除外してから平均
・幾何平均・調和平均:大きな外れ値の影響が算術平均より小さい
「外れ値があると平均はどう動くか」、また「中央値との違いをどう説明するか」を理解しておくと、統計の応用的な場面でも対応できます。