线性回归分析

在方法比较实验中,建议首先将数据图形化,即以测试方法的数值为 y, 以比较方法的数值为 x, 然后目视判断绘制一条通过数据点的直线,还以目视检查对分析误差做出定性评估。以直线回归分析可做出定量的评估。

由于确定通过数据点集的直线的最佳位置所用技术,这一统计程序有时也称为最小二乘分析。手工绘制这条直线时,凭目视判断与所有数据点距离最短的直线。为了画出最佳直线,可以画出好几条,再测量所有数据点到每条直线的距离。计算每条直线到数据点集距离的总和,最小的即为最佳直线。事实上,最佳直线应当与所有数据点对于该直线的距离的平方和为最小,而对于直线距离最大的点对线有较大的影响,这条直线即称为最小二乘直线,其统计过程称为最小二乘分析。

该直线可用如下回归公式予以描述: $$ \large y = a + bx_i \tag 1 $$ 式中:a 为 y 轴截距(直线与 y 轴的交点):b 为斜率(直线在图上的角度)。斜率 (b) 的计算公式如下: $$ \large b= \frac {N \sum x_iy_i - \sum x_i \sum y_i}{N \sum x_i^2 - (\sum x_i)^2} \tag 2 $$ y 轴截距 (a) 的计算公式如下: $$ \large a = \bar y - b \bar x \tag 3 $$

式中:y 和 x 是测试方法和比较方法分别检测患者样品的均值:b 为斜率。

回归统计的理想值中,斜率为 1.000,其余均为 0。只有当测试方法的检测结果与比较方法的结果完全一致时,才能得到这些理想值。这些统计量常偏离它们的理想值,因此可作为分析误差的指示。

回归统计最大的用途是,它可以在方法学比较实验涉及的任何浓度处计算系统误差。

例如,假设 X 是医学决定水平,解释该检测结果很关键。由回归公式,以 X 取代 Xc,以 Yc 取代 y, 计算出相应测试方法值 Yc。, 公式如下: $$ \large Y_c = a + bX_c \tag 4 $$ 然后,可通过如下公式计算系统误差 (SE): $$ \large SE = Y_c - X_c \tag 5 $$ 若 Xc 等于 $\bar x$,则 Yc 等于 $\bar y$,此时 SE 与 t-检验估计的偏移相等。这说明,回归分析可以提供相同的系统误差估计,至少在要求研究浓度的均值处估计误差的情况下是需要的。

相关系数

$$ \large \rho_{X,Y} = \frac{\operatorname{cov}(X,Y)}{\sigma_X \sigma_Y} = \frac{E[(X-\mu_X)(Y-\mu_Y)]}{\sigma_X \sigma_Y} \tag 6 $$