正态分布简介
正态分布 (Normal Distribution),又称高斯分布 (Gaussian Distribution),是统计学中最广泛应用的连续概率分布之一。它的概率密度函数呈现出对称的钟形曲线,因此也被称为钟形曲线。
正态分布由两个参数完全描述:均值 (μ) 决定了分布的中心位置,标准差 (σ) 决定了分布的离散程度。标准正态分布是均值为 0、标准差为 1 的特殊正态分布。
概率密度函数 (PDF)
概率密度函数 (Probability Density Function, PDF) 描述了连续随机变量在某个特定值附近的概率密度。对于正态分布,其 PDF 公式为:
f(x) = (1 / (σ√(2π))) * e^(-(x-μ)²/(2σ²))
其中:
- μ 是均值
- σ 是标准差
- π 是圆周率 (~3.14159)
- e 是自然常数 (~2.71828)
累积分布函数 (CDF)
累积分布函数 (Cumulative Distribution Function, CDF) 描述了连续随机变量小于或等于某个特定值的概率。对于正态分布,其 CDF 是 PDF 从负无穷到 x 的积分。
F(x) = (1 / 2) * [1 + erf((x-μ)/(σ√2))]
其中 erf() 是误差函数。
应用场景
正态分布在各个领域都有广泛的应用:
- ✓ 自然科学:身高、体重等生物特征的分布
- ✓ 社会科学:考试成绩、收入分布
- ✓ 工程学:测量误差、产品质量控制
- ✓ 金融:股票收益率、资产价格分布
常见问题 (FAQ)
什么是标准正态分布?
标准正态分布是均值 μ=0、标准差 σ=1 的正态分布。任何正态分布都可以通过标准化转换为标准正态分布。
如何解释 PDF 和 CDF 的结果?
PDF 表示随机变量在 x 附近的概率密度,而非概率本身。对于连续分布,精确到某个点的概率为 0。
CDF 表示随机变量小于或等于 x 的概率,结果在 0 到 1 之间。