
確率密度関数と累積分布関数の違いをわかりやすく解説!
確率密度関数(PDF)と累積分布関数(CDF)は、確率論や統計学でよく使われる重要な概念です。これら2つの関数は、確率分布を扱う際に非常に役立ちますが、それぞれの役割は異なります。ここでは、確率密度関数と累積分布関数の違いについて詳しく説明します。
確率密度関数とは?
確率密度関数は、連続確率変数が特定の値を取る確率の「密度」を示す関数です。つまり、ある範囲に値が存在する確率を表すために、曲線の下の面積を考えます。連続的なデータに対して使われ、例えば、身長や体重などの分布を表します。
累積分布関数とは?
累積分布関数は、ある値以下の確率を表す関数です。特定の値を超える確率を知りたいときは、1からこの累積分布関数の値を引くことで得られます。これにより、データの「累積」の様子を理解することができます。
確率密度関数と累積分布関数の比較
特徴 | 確率密度関数(PDF) | 累積分布関数(CDF) |
---|---|---|
役割 | 確率の密度を示す | 特定の値までの確率を示す |
データの種類 | 連続データ | 連続または離散データ |
面積の解釈 | 特定の範囲に対する確率の合計 | ある値以下の確率 |
数学的表現 | f(x) が 0 以上 | F(x) が 0 から 1 までの範囲 |
まとめ
確率密度関数と累積分布関数は、確率について理解する上で基本的な概念です。PDFは「確率の密度」を示し、CDFは「累積された確率」を示します。これらを使いこなすことで、データの分析やモデルの構築がより効果的に行えるようになります。
ピックアップ解説
確率密度関数(PDF)についてもう少し深く考えてみましょう
実は、PDFが示す確率は単独の点でのものではなく、範囲に対するものなんです
例えば、ある身長の人がいる確率を求めるとき、全く同じ身長の人がいるかどうかは微小な確率になります
しかし、範囲を設定してあげれば、その範囲内の人がいる確率は計算できます
この特性を利用すると、様々なデータの分析や統計的推測が可能になるのです!
前の記事: « 確率密度関数と確率関数の違いをわかりやすく解説!
次の記事: ピアソンの積率相関係数と相関係数の違いを分かりやすく解説! »