二项分布简介
二项分布是概率论中最常用的离散概率分布之一,用于描述在n次独立重复的伯努利试验中,成功次数的概率分布。每次试验只有两种可能的结果:成功或失败,且每次试验的成功概率p保持不变。
二项分布广泛应用于统计学、遗传学、质量控制、金融学等多个领域。理解二项分布的原理和计算方法,对于统计分析和决策制定至关重要。
二项分布参数
二项分布由两个参数完全描述:
1. 试验次数 (n)
重复独立伯努利试验的次数。
2. 单次成功概率 (p)
每次试验中成功事件发生的概率。失败概率为1-p,通常记为q。
计算公式说明
1. 概率质量函数 (PMF)
概率质量函数描述了在n次试验中恰好有k次成功的概率:
P(X = k) = C(n, k) × p^k × (1-p)^(n-k)
2. 累积分布函数 (CDF)
累积分布函数描述了在n次试验中成功次数不超过k次的概率:
P(X ≤ k) = Σ [C(n, i) × p^i × (1-p)^(n-i)] for i=0 to k
C(n, k)
组合数,计算公式为:C(n, k) = n! / (k! × (n - k)!),表示从n个元素中选择k个元素的组合数。
应用场景
二项分布在各个领域都有广泛的应用,以下是一些常见的例子:
- ✓ 质量控制:检验产品合格数量的概率。
- ✓ 遗传学:计算特定基因型后代的概率。
- ✓ 金融学:计算投资成功次数的概率。
- ✓ 医学研究:计算药物治疗成功人数的概率。
常见问题 (FAQ)
二项分布的适用条件是什么?
二项分布适用于满足以下条件的试验:
- 试验次数n为固定值;
- 每次试验只有两种可能的结果:成功或失败;
- 每次试验的成功概率p保持不变;
- 试验之间相互独立。
如何理解组合数C(n, k)?
组合数C(n, k)表示从n个不同元素中选择k个元素的组合方式的数量。它的计算公式为:C(n, k) = n! / (k! × (n - k)!),其中n!表示n的阶乘,即n! = n × (n-1) × (n-2) × ... × 1。