最小二乗法を使ううえで注意する点
最小二乗法を適用する際には、以下に示すいくつかの重要な注意点が存在する。
■線形関係であることが前提
最小二乗法は、あくまでもデータ間に直線的な関係があることを前提とした分析手法である。もしデータが曲線的な関係を示している場合、この手法は適していない。その際には、多項式回帰といった別の統計的手法を用いる必要が出てくる。
■外れ値に影響されやすい
分析対象のデータに極端な値、いわゆる外れ値が含まれていると、回帰直線がその外れ値に引っ張られ、実態から大きく乖離してしまう可能性がある。そのため、分析を行う前には、必ず散布図などでデータ全体の傾向を事前に確認しておくことが重要だ。
■相関と因果の違いに注意
最小二乗法によって変数間に強い相関関係が見出されたとしても、それが直ちに「一方があることの原因となり、もう一方がその結果である」という因果関係を意味するわけではない。相関関係と因果関係は、統計学上も概念として別物であることを、常に理解しておくべきだ。
まとめ
最小二乗法とは、データが持つ関係性を表現するための手法である。Excelを利用すれば、SLOPE、INTERCEPT、LINESTといった関数や、グラフ機能を駆使することで、直感的に扱うことが可能となる。
本記事で提示した、気温とアイスクリームの売上といった身近なデータを用いて実際に分析を試みることで、最小二乗法への理解を深めてほしい。
本記事の内容を以下で簡単におさらいしておこう。
- 最小二乗法とは
- データに最もよく当てはまる直線(回帰直線)を求める手法。将来予測や傾向分析に活用できる。
- 方法1:SLOPE関数・INTERCEPT関数を使う
- 傾きを求める:=SLOPE(Y範囲, X範囲)
- 切片を求める:=INTERCEPT(Y範囲, X範囲)
- 結果から「Y = aX + b」の式が得られる。
- 方法2:散布図+近似直線を使う
- グラフで関係性を視覚的に確認。
- データを選択→挿入」→「散布図」→「近似曲線の追加」→数式表示
- 方法3:LINEST関数を使う
- 詳細分析に対応。決定係数や誤差も算出。
- 構文:=LINEST(Y範囲, X範囲, TRUE, TRUE)
- 実践例:気温とアイスの売上分析
- 気温(X)と売上(Y)のデータを入力
- SLOPEとINTERCEPTで傾き・切片を計算
- 散布図を作成し、近似曲線で精度を確認
- 最小二乗法の効果
- データの傾向を数式で把握できる
- 未観測のX値に対してYを予測できるため、将来予測や需要分析に有用
関連記事:「Excelを使って相関係数を求める方法と注意点」
構成/編集部