ANCOVA是带连续协变量的方差分析,本质为含分类变量与连续协变量的线性回归;需检验平行线假设,拟合主效应模型后解读组间净差异,协变量须事前测量且具理论依据。

协方差分析(ANCOVA,Analysis of Covariance)不是纯Python算法,而是统计建模方法——它本质是“带连续协变量的方差分析”,即在线性模型中同时纳入分类自变量(如实验组别)和连续协变量(如基线测量值),以控制混杂效应、提升检验效能。Python本身不内置ANCOVA专用函数,但可通过statsmodels或scipy拟合含交互项的线性回归模型来等价实现。
ANCOVA的数学结构:就是带分组哑变量的线性回归
假设有1个分类因子A(k个水平,如对照组/用药组/安慰剂组),1个连续协变量X(如治疗前血压),因变量Y(如治疗后血压)。ANCOVA模型写为:
Yij = μ + αi + β(Xij − X̄) + εij
其中:μ是总均值,αi是第i组的主效应(满足∑αi=0),β是协变量X的公共斜率(假设各组斜率相等,即“平行线假设”),X̄是X的总体均值(中心化可避免主效应与协变量估计耦合),εij ~ N(0, σ²)。
立即学习“Python免费学习笔记(深入)”;
实际建模时,用哑变量(dummy coding)表示组别,例如3组生成2个哑变量D₁、D₂,则模型变为:
还木有评论哦,快来抢沙发吧~