【超几何分布的方差公式】在概率论与统计学中,超几何分布是一种描述在不放回抽样情况下成功次数的概率分布。它常用于有限总体中的抽样问题,例如从一批产品中抽取样本进行质量检测等。了解超几何分布的方差有助于我们更好地理解其随机变量的波动性。
一、超几何分布的基本概念
超几何分布适用于以下情况:
- 总体中有 $ N $ 个个体;
- 其中 $ K $ 个个体具有某种特征(称为“成功”);
- 从中随机抽取 $ n $ 个个体(不放回);
- 设随机变量 $ X $ 表示这 $ n $ 个个体中具有该特征的数量。
则 $ X $ 服从参数为 $ (N, K, n) $ 的超几何分布,记作 $ X \sim \text{Hypergeometric}(N, K, n) $。
二、超几何分布的期望与方差
超几何分布的期望和方差是衡量其集中趋势和离散程度的重要指标。以下是它们的计算公式:
项目 | 公式 | 说明 |
期望值(均值) | $ E(X) = n \cdot \frac{K}{N} $ | 表示在 $ n $ 次抽样中平均能抽到的“成功”数量 |
方差 | $ \text{Var}(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ | 描述了随机变量 $ X $ 的波动程度 |
其中,$ \frac{N - n}{N - 1} $ 是一个修正因子,用于调整不放回抽样的影响,使得方差小于同参数下的二项分布。
三、对比:超几何分布与二项分布的方差
在二项分布中,每次抽样都是独立的,且总体无限大或抽样后放回,因此其方差为:
$$
\text{Var}(X) = n \cdot p \cdot (1 - p)
$$
而在超几何分布中,由于是不放回抽样,样本之间存在相关性,因此方差会比二项分布小,具体体现在修正因子 $ \frac{N - n}{N - 1} $ 上。
四、实例分析
假设某批产品共有 100 件,其中有 30 件是次品。从中随机抽取 10 件,设 $ X $ 为抽到的次品数,则:
- $ N = 100 $, $ K = 30 $, $ n = 10 $
- $ E(X) = 10 \times \frac{30}{100} = 3 $
- $ \text{Var}(X) = 10 \times \frac{30}{100} \times \left(1 - \frac{30}{100}\right) \times \frac{100 - 10}{100 - 1} \approx 2.12 $
这表明,在平均情况下,抽到 3 件次品,但实际结果可能围绕这个值上下波动。
五、总结
超几何分布的方差公式是:
$$
\text{Var}(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1}
$$
它反映了在不放回抽样下,随机变量的离散程度。相较于二项分布,超几何分布的方差更小,这是由于样本之间的相关性所致。
通过掌握这一公式,我们可以更准确地评估在有限总体中进行抽样时的不确定性,从而做出更合理的统计推断。