
決定係数と相関係数の違いをわかりやすく解説!
データ分析や統計の世界では、様々な指標を使ってデータの関係性や傾向を探ります。今回はその中でも特に重要な「決定係数」と「相関係数」について解説します。この2つの指標は一見似ているようでありながら、実は異なる概念を表しています。それぞれの特徴や違いを詳しく見ていきましょう。
決定係数とは?
決定係数(R²)は、回帰分析における重要な指標です。簡単に言うと、これは「どれだけの割合のデータのばらつきが、回帰モデルによって説明されているか」を示します。0から1の値を取り、1に近いほどモデルがデータをよく説明していることを意味します。
決定係数の例
例えば、ある商品の販売数と広告費用の関係を調べるために回帰分析を行ったとします。その結果、決定係数が0.9であれば、広告費用によって販売数の約90%が説明可能であることがわかります。
相関係数とは?
一方、相関係数(r)は、2つの変数の間にどの程度の関連性があるかを示す指標です。-1から1の値を取り、1に近いほど強い正の相関、-1に近いほど強い負の相関を示します。0に近い場合は、ほとんど相関がないことを意味します。
相関係数の例
たとえば、商品の価格と販売数の関係について調べた場合、相関係数が-0.8であれば、価格が上がるにつれて販売数が下がるという強い負の相関があることがわかります。
決定係数と相関係数の比較
特性 | 決定係数 (R²) | 相関係数 (r) |
---|---|---|
値の範囲 | 0〜1 | -1〜1 |
意味 | データのばらつきの説明割合 | 変数間の関連性の強さ |
使用場面 | 回帰分析 | 相関分析 |
まとめ
決定係数と相関係数は、データを理解するための異なる視点を提供します。決定係数はモデルがデータをどれだけ説明できているかを示し、相関係数は2つの変数の関係性を明らかにします。両者を正しく理解し、使い分けることで、データ分析の精度を高めることができます。
決定係数は、特に回帰分析でのモデル評価において非常に重要です
モデルがどれだけ実データに合っているかを数値化することで、より良い選択をするためのガイドにもなります
例えば、学校のテストの得点を予測する際に、過去のデータから見えてくるトレンドを利用することで、将来の得点をより正確に予測できるのです
これは、ただ単にデータを眺めているだけではわからない、データの背後にある関係性を明らかにするのです
前の記事: « 有意水準と臨界値の違いをわかりやすく解説!
次の記事: 相互相関と相関係数の違いを徹底解説!わかりやすく学べる統計の世界 »