合格か不合格か――2択の問題を確率で予測する、分類の基本アルゴリズム
ロジスティック回帰は、「合格か不合格か」「クリックするかしないか」のような2択の結果を予測するアルゴリズムです。 最終的な答えは「合格」か「不合格」の分類ですが、その判定のために内部でまず確率を計算するのが特徴です。
たとえば「勉強時間6時間 → 合格確率82% → 50%を超えているので合格と判定」という流れです。 線形回帰が「売上は◯◯万円」と数値そのものを予測するのに対し、ロジスティック回帰は確率を経由してどちらのグループに属するかを予測します。 名前に「回帰」とありますが、この確率を計算する部分に回帰の仕組みを使っているためで、目的はあくまで分類です。
その仕組みは、線形回帰の出力をシグモイド関数(S字カーブ)に通して 0〜1の範囲に変換するというシンプルなものです。上のグラフの紫の曲線がまさにシグモイド関数で、オレンジの破線が「ここから右なら合格と判定する」境界線です。
ロジスティック回帰は線形回帰の「親戚」です。中身の計算は似ていますが、出力をシグモイド関数で確率に変換することで分類問題に対応しています。
| 線形回帰 | ロジスティック回帰 | |
|---|---|---|
| 目的 | 数値を予測(回帰) | クラスを予測(分類) |
| 出力 | −∞ 〜 +∞ の連続値 | 0 〜 1 の確率 |
| 活性化関数 | なし(恒等関数) | シグモイド関数 σ(z) |
| 損失関数 | MSE(平均二乗誤差) | クロスエントロピー |
| 解法 | 正規方程式(一発) | 勾配降下法(反復) |
| 例 | 売上予測、気温予測 | スパム判定、合否予測 |
上のツールで学習率やエポック数を変えてみてください。線形回帰(OLS)は正規方程式で一発で解が出ますが、 ロジスティック回帰は反復的に最適解に近づいていくという違いがあります。 損失曲線パネルでその収束の様子が確認できます。