平均を中心に左右対称の釣鐘型を描く、最も基本的な連続確率分布。
正規分布(Normal Distribution)は、平均 μ を中心に左右対称の釣鐘型(ベル型)を描く連続確率分布です。ガウス分布とも呼ばれ、確率・統計の中で最も基本的かつ重要な分布です。
身近な例として、成人男性の身長、テストの得点分布、工場で製造された部品の寸法誤差などは、おおむね正規分布に従うことが経験的に知られています。多数のランダムな要因が独立に足し合わさるとき、その合計は正規分布に近づく(中心極限定理)ためです。
記号は N(μ, σ²) と書きます。確率密度関数は f(x) = (1/√(2πσ²)) × exp(−(x−μ)²/(2σ²)) で、特に μ=0, σ=1 としたものを標準正規分布と呼びます。「偏差値」「品質管理(3σ法)」「信頼区間」などは、いずれも正規分布を土台にした考え方です。
正規分布はたった 2 つのパラメータ μ と σ だけで完全に形が決まるのが特徴です。それぞれの役割は明確に分かれています。
・μ(平均、ミュー)は分布の中心位置を決めます。μ を変えると、釣鐘の山ごと左右にスライドします。μ が分布の代表値(中央値・最頻値とも一致)になります。
・σ(標準偏差、シグマ)は分布の広がりを決めます。σ が小さいほど山は鋭く尖り(データが平均周りに集中)、σ が大きいほど幅広くなだらかになります(データのばらつきが大きい)。
具体例: 2 校のテスト結果
A校: μ=60点, σ=5 → ほぼ全員が 50〜70点に集まる
B校: μ=60点, σ=15 → 30点台から90点台まで幅広く分散
平均は同じでも σ が違えば実態はまったく違います。「平均だけ見るな、ばらつき(σ)も見ろ」が統計の鉄則です。ある値が μ から何σ離れているかは、標準化(z = (x−μ)/σ)で計算します。
正規分布には「68-95-99.7 ルール」(または経験則 / 3σ ルール)と呼ばれる有名な性質があります。μ から ±σ、±2σ、±3σ の範囲に入る確率がそれぞれおよそ決まっているというものです。
| 範囲 | 確率 | 残り(外側) |
|---|---|---|
| μ ± 1σ | 約 68.27% | 約 31.7% |
| μ ± 2σ | 約 95.45% | 約 4.55% |
| μ ± 3σ | 約 99.73% | 約 0.27% |
身近な応用: 品質管理の 3σ ルール
製造業では、製品の寸法が μ ± 3σ の外に出ると不良品と判定します。正常に動いている工程なら 99.73% は範囲内に収まるはずで、これを超えて外れる製品が増えたら工程に異常があるサインです。
このルールのポイント:
・「平均 ± 標準偏差の範囲に約 68% が入る」
・「平均 ± 2 × 標準偏差で約 95%」は信頼区間の基礎になる
・μ や σ の値が変わってもこの比率は変わらない
例えば偏差値は「μ=50, σ=10」の正規分布に近づけた値なので、偏差値 40〜60 に約 68% の人、偏差値 30〜70 に約 95% の人がいることになります。偏差値 70 以上はわずか約 2.3%(上位 100 人中 2 人)、偏差値 80 以上は約 0.13%(1000 人中 1 人)。直感的な人数感覚もこのルールから導けます。
結論: 多数の小さな要因が足し合わさると、合計は自然と釣鐘型(正規分布)に近づきます。これを中心極限定理(=「足し合わせると正規になる」という統計の大法則)と呼びます。
なぜそうなるのか。人の身長を例に考えましょう。身長は1つの要因ではなく、遺伝・栄養・睡眠・運動・環境…といった無数の小さな要因が独立してランダムに影響します。それぞれの要因は「+少し」「−少し」とばらつきますが、たくさん足すとプラスとマイナスが打ち消し合い、中間付近に集まるようになります。極端に大きくも小さくもなりにくいのです。
身近なアナロジーで言うと、コインを100回投げて「表の数」を数える実験に似ています。1回の結果は半々ですが、100回の合計は「だいたい50回前後」に集中し、0回や100回はほぼ起こりません。要因が多いほど中央に寄り、釣鐘がより滑らかになっていきます。
・身長・体重:遺伝・栄養・環境など多数の要因の合計
・テストの得点:各問の正誤がランダムに積み重なった結果
・工場の部品の寸法誤差:加工時の小さなズレの積み重ね
結論: あるデータが平均から「何σ分離れているか」を表す数値を z値(=標準化スコア)といいます。計算式は z = (x − μ) / σ です。
なぜ標準化が必要なのか。「A校で70点」と「B校で70点」は同じ点数に見えますが、A校の平均が60点・B校の平均が80点なら実力は全然違います。z値を使えば「その分布の中でどれくらいの位置にいるか」を共通の物差しで比べられます。
具体例として、テストで μ=60点・σ=10点の場合を見てみましょう。
・70点の人:z = (70−60)/10 = 1.0(平均から +1σ の位置)
・50点の人:z = (50−60)/10 = −1.0(平均から −1σ の位置)
・60点の人:z = (60−60)/10 = 0(ちょうど平均)
偏差値はこのz値を「μ=50、σ=10」の正規分布に換算した値で、偏差値 = 50 + 10 × z で計算できます。z値が +1.0 なら偏差値60、z値が −1.0 なら偏差値40になります。偏差値の正体は「平均からの距離を標準偏差の倍数で表したもの」だったのです。