
二項分布と超幾何分布の違い
統計学には、様々な確率分布がありますが、特に「二項分布」と「超幾何分布」の2つは似ている部分もある一方で、重要な違いもあります。本記事では、これら2つの分布について、中学生でもわかりやすいように解説します。
二項分布とは
二項分布は、成功確率が一定の試行をn回行った時の成功回数の分布です。たとえば、「コインを10回投げて、表が出る回数」を考えてみましょう。この時、表が出る確率が0.5(50%)の場合、これが二項分布になります。公式は次のようになります:
B(n, p) = C(n, k) * p^k * (1-p)^(n-k)
ここで、Bは二項分布、nは試行回数、pは成功確率、C(n,k)は組み合わせの数を示します。
超幾何分布とは
超幾何分布は、全体の中からいくつかのサンプルを取り出した時の成功の確率を表す分布です。たとえば、50個のボールの中に20個の赤いボールがあるとします。この時、無作為に10個のボールを引いた時に、何個の赤いボールが出るかを考える場合が超幾何分布になります。関連する公式は次のようになります:
H(N, K, n, k) = C(K, k) * C(N-K, n-k) / C(N, n)
ここで、Hは超幾何分布、Nは全体の数、Kは成功数、nはサンプル数、kは成功数を示します。
二項分布と超幾何分布の違い
特徴 | 二項分布 | 超幾何分布 |
---|---|---|
試行の独立性 | 独立(成功確率が一定) | 依存(全体からサンプリング) |
成功確率 | 一定 | 変動(サンプル減少) |
使用シーン | 同じ条件での試行 | 限られたサンプルからの抽出 |
まとめ
二項分布と超幾何分布は、試行やサンプルを考える際に重要な統計学の分布です。それぞれの特性を理解し、適切に使い分けることで、データ分析や確率の計算がより効果的になります。
二項分布と超幾何分布は、一見似たような状況で使うことが多いですが、実はその根底には大きな違いがあります
例えば、あるゲームの中でサイコロを投げた時の成功を考えると、二項分布は全ての投げ方において同じ確率です
しかし、超幾何分布は「すでにサイコロをいくつか投げた後」に新たに投げるというように、条件が変わる状況で使います
このように、状況や条件に応じて適切な分布を選ぶことが、データ分析では非常に重要です
前の記事: « 二項分布と負の二項分布の違いをやさしく解説!
次の記事: 共分散構造分析と因子分析の違いをわかりやすく解説! »