FE EXAM

正規分布(N(μ, σ²))

平均を中心に左右対称の釣鐘型を描く、最も基本的な連続確率分布。

INTERACTIVE VISUALIZATION
±1σ (68%)
±2σ (95%)
±3σ (99.7%)
平均 μ
0.0
標準偏差 σ
1.0
ピーク密度 f(μ)
0.399
μ(平均)0.0
-5.05.0
σ(標準偏差)1.0
0.53.0
プリセット
確率密度関数 f(x)
-10-8-6-4-20246810μ=0.0-3σ-2σ-1σ+1σ+2σ+3σ
μ ± 1σ の範囲
68.27%
[-1.00, 1.00]
μ ± 2σ の範囲
95.45%
[-2.00, 2.00]
μ ± 3σ の範囲
99.73%
[-3.00, 3.00]
計算式
f(x) = (1 / √(2πσ²)) × exp(−(x−μ)² / (2σ²))

平均 μ で最大値、左右対称の釣鐘型を描く。σ が小さいほど鋭く尖り、σ が大きいほど幅広くなだらかになります。

解説

📈
正規分布とは

正規分布(Normal Distribution)は、平均 μ を中心に左右対称の釣鐘型(ベル型)を描く連続確率分布です。ガウス分布とも呼ばれ、確率・統計の中で最も基本的かつ重要な分布です。

身近な例として、成人男性の身長テストの得点分布工場で製造された部品の寸法誤差などは、おおむね正規分布に従うことが経験的に知られています。多数のランダムな要因が独立に足し合わさるとき、その合計は正規分布に近づく(中心極限定理)ためです。

記号は N(μ, σ²) と書きます。確率密度関数は f(x) = (1/√(2πσ²)) × exp(−(x−μ)²/(2σ²)) で、特に μ=0, σ=1 としたものを標準正規分布と呼びます。「偏差値」「品質管理(3σ法)」「信頼区間」などは、いずれも正規分布を土台にした考え方です。

🎯
平均μと標準偏差σの役割

正規分布はたった 2 つのパラメータ μ と σ だけで完全に形が決まるのが特徴です。それぞれの役割は明確に分かれています。

μ(平均、ミュー)は分布の中心位置を決めます。μ を変えると、釣鐘の山ごと左右にスライドします。μ が分布の代表値(中央値・最頻値とも一致)になります。
σ(標準偏差、シグマ)は分布の広がりを決めます。σ が小さいほど山は鋭く尖り(データが平均周りに集中)、σ が大きいほど幅広くなだらかになります(データのばらつきが大きい)。

具体例: 2 校のテスト結果

A校: μ=60点, σ=5 → ほぼ全員が 50〜70点に集まる
B校: μ=60点, σ=15 → 30点台から90点台まで幅広く分散

平均は同じでも σ が違えば実態はまったく違います。「平均だけ見るな、ばらつき(σ)も見ろ」が統計の鉄則です。ある値が μ から何σ離れているかは、標準化(z = (x−μ)/σ)で計算します。

📊
68-95-99.7ルール

正規分布には「68-95-99.7 ルール」(または経験則 / 3σ ルール)と呼ばれる有名な性質があります。μ から ±σ、±2σ、±3σ の範囲に入る確率がそれぞれおよそ決まっているというものです。

範囲確率残り(外側)
μ ± 1σ約 68.27%約 31.7%
μ ± 2σ約 95.45%約 4.55%
μ ± 3σ約 99.73%約 0.27%

身近な応用: 品質管理の 3σ ルール
製造業では、製品の寸法が μ ± 3σ の外に出ると不良品と判定します。正常に動いている工程なら 99.73% は範囲内に収まるはずで、これを超えて外れる製品が増えたら工程に異常があるサインです。

このルールのポイント:
・「平均 ± 標準偏差の範囲に約 68% が入る」
・「平均 ± 2 × 標準偏差で約 95%」は信頼区間の基礎になる
・μ や σ の値が変わってもこの比率は変わらない

例えば偏差値は「μ=50, σ=10」の正規分布に近づけた値なので、偏差値 40〜60 に約 68% の人偏差値 30〜70 に約 95% の人がいることになります。偏差値 70 以上はわずか約 2.3%(上位 100 人中 2 人)、偏差値 80 以上は約 0.13%(1000 人中 1 人)。直感的な人数感覚もこのルールから導けます。

📌
なぜ正規分布は自然界に現れるのか

多数の小さな要因がランダムに積み重なる遺伝栄養睡眠運動合計釣鐘型に近づく=正規分布(中心極限定理)

結論: 多数の小さな要因が足し合わさると、合計は自然と釣鐘型(正規分布)に近づきます。これを中心極限定理(=「足し合わせると正規になる」という統計の大法則)と呼びます。

なぜそうなるのか。人の身長を例に考えましょう。身長は1つの要因ではなく、遺伝・栄養・睡眠・運動・環境…といった無数の小さな要因が独立してランダムに影響します。それぞれの要因は「+少し」「−少し」とばらつきますが、たくさん足すとプラスとマイナスが打ち消し合い、中間付近に集まるようになります。極端に大きくも小さくもなりにくいのです。

身近なアナロジーで言うと、コインを100回投げて「表の数」を数える実験に似ています。1回の結果は半々ですが、100回の合計は「だいたい50回前後」に集中し、0回や100回はほぼ起こりません。要因が多いほど中央に寄り、釣鐘がより滑らかになっていきます。
身長・体重:遺伝・栄養・環境など多数の要因の合計
テストの得点:各問の正誤がランダムに積み重なった結果
工場の部品の寸法誤差:加工時の小さなズレの積み重ね

📌
標準化とz値—「平均から何σ離れているか」

μ=60x=70x−μ=10z = (70−60)/10 = 1.0

結論: あるデータが平均から「何σ分離れているか」を表す数値を z値(=標準化スコア)といいます。計算式は z = (x − μ) / σ です。

なぜ標準化が必要なのか。「A校で70点」と「B校で70点」は同じ点数に見えますが、A校の平均が60点・B校の平均が80点なら実力は全然違います。z値を使えば「その分布の中でどれくらいの位置にいるか」を共通の物差しで比べられます。

具体例として、テストで μ=60点・σ=10点の場合を見てみましょう。
70点の人z = (70−60)/10 = 1.0(平均から +1σ の位置)
50点の人z = (50−60)/10 = −1.0(平均から −1σ の位置)
60点の人z = (60−60)/10 = 0(ちょうど平均)

偏差値はこのz値を「μ=50、σ=10」の正規分布に換算した値で、偏差値 = 50 + 10 × z で計算できます。z値が +1.0 なら偏差値60、z値が −1.0 なら偏差値40になります。偏差値の正体は「平均からの距離を標準偏差の倍数で表したもの」だったのです。

関連コンテンツ