卡方检验简介
卡方检验 (Chi-Square Test) 是一种非参数统计方法,用于分析分类变量之间的关联或检验观察频数与期望频数是否存在显著差异。它在生物医学研究中被广泛应用于群体遗传学、流行病学、临床试验等领域。
卡方检验的核心思想是比较实际观察到的频数分布与理论期望的频数分布之间的差异程度,如果差异足够大,则拒绝原假设。
卡方检验类型
卡方检验主要有两种常见类型:
- 1. 拟合优度检验 (Goodness of Fit) 用于检验观察频数是否符合某种理论分布(如均匀分布、二项分布等)。适用于单变量分类数据。
- 2. 独立性检验 (Test of Independence) 用于检验两个分类变量之间是否存在关联。适用于二维列联表数据,通过交叉分类研究变量间的独立性。
计算公式
卡方检验的基本公式为:
χ² = Σ[(Oᵢ - Eᵢ)² / Eᵢ]
应用场景
卡方检验在生物医学研究中有广泛的应用,主要包括:
- ✓ 流行病学研究中的病例对照分析
- ✓ 临床试验中不同处理组的疗效比较
- ✓ 群体遗传学中的基因型分布检验
- ✓ 医学诊断试验的灵敏度和特异性分析
结果解读
卡方检验结果主要包括三个关键指标:卡方值 (χ²)、自由度 (df) 和 P值。
卡方值
反映观察频数与期望频数之间的差异程度,值越大表示差异越显著。
自由度
拟合优度检验:df = 类别数 - 1;独立性检验:df = (行数 - 1)(列数 - 1)。
P值
P < 0.05 表示差异有统计学意义;P < 0.01 表示差异极显著。
常见问题 (FAQ)
卡方检验的适用条件是什么?
卡方检验适用于分类变量数据,通常要求每个单元格的期望频数 (E) 不小于 5。当 E < 5 时,建议使用 Fisher 精确检验。
如何输入二维列联表数据?
使用分号 (;) 分隔行,逗号 (,) 分隔列。例如,2×2 列联表 "20,30;40,50" 表示第一行两个单元格为 20 和 30,第二行两个单元格为 40 和 50。
自由度如何计算?
拟合优度检验:自由度 = 类别数 - 1;
独立性检验:自由度 = (行数 - 1) × (列数 - 1)。