正确运用和解释统计量是关键。

方法确认中常用的统计量包括均值、标准差、变异系数、均值的标准误、配对 t-检验、线性回归分析及相关

均值、标准差、变异系数

均值 (x) 是一组数值的集中趋势或中心位置的度量。标准差 (s) 是一组检测结果对于均值离散或分布的度量。变异系数 (CV) 是以均值的百分比表示的标准差。公式如下: $$ \large \bar x = \frac {\sum x_i} {N} \tag {1} $$

$$ \large s = \sqrt \frac {\sum(x_i-\bar x)^2} {N-1} \tag {2} $$

$$ \large CV = \frac {s (100%)} {x} \tag {3} $$ 式中:$x_i$ 是单个观测值;$\bar x$ 是系列观测值的均值;N 是系列观测值的总数。

均值标准误

均值的分布由一个称为均值标准误 ($s_{\bar x}$) 的统计量来表示,其计算公式如下: $$ \large s_{\bar x} = \frac {s}{\sqrt{N}} \tag {4} $$

式中:$s$ 是标准差,代表由重复检测估计得到的单个检测值的离散;N 是均值中包含的检测次数。

以估计系统误差为目的的确认实验中,如回收和干忧实验,对多次检测或多个样品结果取均值通常是有用的。不仅可以减少方法随机误差的影响,也可以评估随机误差相对较大的方法中很小的系统误差。检测的真均值将被包含在环绕实验均值两侧的可信区间内,如以下公式所示: $$ \large \mu = \bar x \pm t \frac {s}{\sqrt{N}} \tag {5} $$

由均值标准误 (s/√N) 和一个乘数 (t) 计算得到区间宽度。这个乘数须与自由度 N-1 和期望的可信水平(常为 90%、95%或 99%) 相应。t 值乘数的数值从统计表中获取,该表通常列出的 1 为自由度、概率 (p) 的函数。p=0.1 的 1 值用于计算 90%的可信区间,p=0.05 的 t 值用于计算 95% 的可信区间,p=0.01 的 t 值用于计算 99%的可信区间。

当 p = 0.05 且 df 趋于无穷大时,t 值趋于 1.96。一般而言,当 d≥20 时,可以 2 为乘数计算 95%的可信区间,该区间将准确至 4%之内。这是以 ±2 用作估计 95%可信区间一般模式的基础。请注意,随着 df 减小,尤其在 10 以下时,t 值会大得多。正因如此,对于回收和干忧实验等,它们的 df 或 N-1 可能较小,得到正确的 t 值就格外重要。

例:运用公式计算系统误差估计可信区间

以下为一个回收实验的数据:94%、96%、95%、96%、99%、97%、100%、96%、 98%。这 9 个值的平均回收率 ($\bar x $) 为 96.8%,标准差 ($s$) 为 1.9% 真实平均回收率 ($\mu$) 估计的 95%区间为: $$ \large \mu = 96.8% \pm 2.31 \times \frac {1.9}{\sqrt{9}} \tag {6} $$ 式中:2.31 是 df(V-1) 为 8 和 p=0.05 时的 t 值。95.3%~98.3% 的区间有 95% 的机会或概率包含了真实平均回收率。真实平均回收率落在此区间外的机会或概率只有 5%。

显著性检验与可信区间 统计检验,如 t-检验和 F-检验,常用来确定两个能参数估的量值间是否存在差异。这些检验被称为显著性检验,它们检验实 验数据是否足以证明观测到了差别。被检验的假设称为无效假设,即声明两个量值间没有差别。当检验统计量(t 或 F)足够大时,证明无效假设不成立,结论是该差别有统计学意义。通俗地讲,就是观测到了真实的差别。若检验统计量很小,结论是无效假设成立,在两个量间的差别无统计学意义,即没有观测到真实的差别。

配对 t-检验

t-检验可用于检验两个均值,判断它们之间是否存在差别,有配对和非配对 t 一检验。区别在于比较的均值来自相同的统计抽样还是不同的统计抽样。例如,在方法比较实验中,每个样品同时被测试方法和比较方法检测,此种对一组样品进行配对检测的情况适用配对 t-检验。与此相反,非配对 t-检验适用于检验两个不同组样品均值间的差别,比如男性和女性参考值均值间的差别。本章仅介绍配对 t-检验的计算。需要计算三个统计量。

偏移是两个均值间的差值: $$ \large bias = \bar y -\bar x \tag 7 $$

式中:$\bar y$ 和 $\bar x$ 为均值。

差值标准差 (SD~diff~) 的计算公式如下: $$ \large SD_{diff} = \sqrt {\frac {\sum{[(y_i-x_i)-bias]^2}}{N-1}} \tag 8 $$ 最后,计算 t 值: $$ \large t = \frac {bias}{SD_{diff}/\sqrt{N}} \tag 9 $$ 此公式体现了 t 值的性质。它是两个部分的比值,一个代表系统差异或误差(偏移),另一个代表随机误差 (SD/√N)。此种情况下,因为它检验的是均值,因此具有均值标准误的形式。t 值的含义是系统误差相当于随机误差的倍数。例如,t 值为 6 时,说明系统误差是随机误差的 6 倍。如此大的系统误差远大于实验数据中因不确定度对观测值的影响。比值大于 2 或 3 是不正常的。若该比值很大,常说明实验数据证明均值间有真实差别,或存在系统误差。

将第一个公式计算的 t 值与统计表中的临界 t 值进行比较,做出较精确的 t-检验的解释。其检验的假设是两个均值间没有差异(无效假设)。

如果观测 t 值大于表中的对应临界 t 值,则无效假设被拒绝,说明两个均值间存在差别,或观测到系统误差,通常声明为差别或系统误差有统计学意义,意思是观测到的差别大于由实验数据中的不确定度或检测中的随机误差带来的预期影响。得出的结论是,实验数据足以证明存在系统误差。

反之,若观测 t 值小于表中临界 t 值,则无效假设成立,说明两个均值间不存在差别,观测到的差别或系统误差无统计学意义,意即实验数据未证明存在系统误差。

唯一能从 t 值得出的结论是是否存在系统误差。

F-检验

在方法确认研究中,有时用 F-检验比较测试方法与比较方法的方差。方差即标准差的平方。如果说 t-检验告诉我们两个均值之间的差别是否有统计学意义,那么 F-检验则用来告知方差间的差别是否有统计学意义。简言之,t-检验用于测量系统误差或不准确度,而 F-检验用于测量随机误差或不精密度。

F-检验需要将测试方法和比较方法的标准差分别平方,将较大的方差除以较小的方差,计算公式如下: $$ \large F = \frac {s_1^2}{S_2^2} \tag {10} $$

式中:s1 是较大的方差(或精密度较低的方法);s2 是较小的方差(或精密度较高的方法)。将计算的 F 值与统计表中查得的临界 F 值比较解释 F-检验。检验的无效假设为两个方法的方差无差别。当观测的 F 值大于临界 F 值时,无效假设不成立,说明方差或随机误差的差别有统计学意义。

通俗地讲,就是数据足以说明,在 F-检验计算公式分子上的方法随机误差大于在分母上的方法随机误差。而当观测的 F 值小、于临界 F 值时,无效假设成立,说明两个方法的方差或随机误差无差异。

自由度为无限大(n=120)的 t-分布和正态分布等价

单侧 75% 80% 85% 90% 95% 97.5% 99% 99.5%
双侧 50% 60% 70% 80% 90% 95% 98% 99%
1 1.000 1.376 1.963 3.078 6.314 12.71 31.82 63.66
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704
50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678
60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660
80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639
100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
无穷大 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576