目标:

  • 学习估计方法精密度的实用程序
  • 了解重要的实验因素
  • 计算实验数据,评估不精密度

重复性实验

几乎所有检测方法都有随机变异。

重复检测常会出现稍稍不同的结果,有时略高些,有时又略低些。

重复性实验用来估计分析方法的不精密度或随机误差。

在方法确认研究中,确定随机误差的大小常是首先要做的工作之一。

重复性实验的典型做法:

首先取得对同一材料进行 20 次取样检测的结果,然后计算均值、标准差和变异系数。

目的是观测检测结果在实验室正常运行条件下的预期变异。理想情况下,检测变异应当很小,即重复检测的所有结果应当几乎相同

影响因素

重复性实验估计的是由方法运行中波动因素所致的随机误差,如吸样、与时间关联的反应条件、混匀、温度、加热乃至检测本身。

在非自动化系统中,检测者个人的技术波动可能是某项检测观测变异的一大主因。

对于自动化检测系统,仪器和反应条件的不一致和不稳定仍可导致微小波动,并导致最终检测结果呈正向或负向波动。尽管任何时候都无法预测确切影响,但可以预测这些影响的动态分布,并了解随机误差可能的大小。

实验设计考虑的因素

实验设计的重要因素包括实验持续时间、被检测样品的基质、检测材料的数量和浓度以及检测抽样数。尽管认为执行检测的检测者人数也可能是一个因素,但此变量在方法确认研究中一般进行了控制,因为只有一个或少数培训良好的检测者才能参与这些研究。

实验持续时间

实验持续的时间对于数据解释和可能的结论非常关键。若样品在单个分析批内检测,观测到的“批内”随机误差通常很小(并且很乐观),因为结果仅受这个短时间内变异的影响。这或许是该方法的最佳性能,若不能接受这一性能,则应拒绝该方法,或在发现并消除随机误差原因后再进行实验。

若在一天内进行实验,即“天内”,常可比连续进行的批内实验呈现更多变异,除非方法的自动化程度很高且非常稳定。若在 20 天内进行实验,可提供常见于患者样品随时间变化的更实际的变异估计。此种估计可称为方法的“每天”“天间”或“总”不精密度。 CLSI 更喜欢用“总不精密度”,可能因为它暗指包含了变异的天内和天间部分。

样品基质

在评价方法性能时,应当使用尽可能接近真实标本类型基质的测试样品。

需要检测的材料数量和浓度

需要检测的材料数量应取决于医学应用中该检测项目的临界浓度。一般而言,应在重要医学决定水平附近选择两个或三个不同分析物浓度的材料。医学决定水平是检测结果在临床解释上的关键浓度。

检测样品数量

通常认为应在规定的时间段内至少检测 20 个样品。样品数更大可提供对随机误差更充分的估计,但出于成本和时间考虑,常会规定在最早时间或最短周期评价数据,必要时再追加收集数据。

数据计算

根据检测次数 $n$ 和 $\sum x_i$,计算得到的均值 $(\bar x)$、标准差 $(s)$ 和变异系数 (CV) 可定量描述随机误差,公式如下: $$ \bar x = \frac {\sum x_i} {n} \tag 1 $$

$$ s = \sqrt{\frac {\sum(x_i-\bar x)^2}{n-1}} \tag 2 $$

$$ CV = \left ( \frac {s} {\bar x} \right ) \cdot 100 \tag 3 $$

对于双份检测的患者标本,根据双份检测间的差值 d 计算双份检测标准差 ($s_{dup}$), 公式如下:

$$ s_{dup} = \sqrt {\frac {\sum d^2}{2n}} \tag 4 $$ 式中:n 是各个患者标本的个数。

可接受性的判断标准

可接受性的判断取决于在不影响或者限制某项目检测结果解释前提下允许的分析误差量。鉴 于才开始接触规定的允许误差大小,我们建议使用 CLIA 的可接受性标准。

对于短期不精密度,批内标准差 ($s_{w-run}$) 或天内标准差 ($s_{w-day}$) 小于或等于规定允许总误差 ($TE_a$) 的 1/4 为可接受。

对于长期不精密度,总标准差 ($s_{tot}$) 小于或等于规定允许总误差 ($TE_a$) 的 1/3 为可接受。

验证厂商声明

CIIA 并未严格要求实验室必须确定性能的可接受性,而是规定实验室应当验证厂商声明的精密度。这可通过 F-检验来完成,具体做法如下:

  • 从厂商声明的重复性实验中找到预期 SD 和检测次数(通常包含在仪器文件资料中),如根据 31 次检测得到的 SD 为 3 mg/dl。
  • 从自己的重复性实验中得到 SD 和检测次数,如根据 21 次检测得到的 SD 为 4mg/dl。
  • 计算 F 值,用较大 SD 的平方除以较小 SD 的平方,即 (4)2/(3)2=16/9=1.78
  • 在 F 临界值表中查找 F 值,根据分子中的自由度为 20(df=N-1) 和分母中的自由度为 30,该临界 F 值应为 1.93。
  • 本例中,计算的 F 值小于临界 F 值,说明实验室观测 SD 与厂商声明 SD 之间无真实差异。

结论:厂商声明通过验证!

推荐的最小实验

为某检测项目选择至少两个代表低和高医学决定浓度的控制品。在一个分析批内或一天内,对每个控制品分别进行 20 次检测,得到短期不精密度的评价。计算每个控制品的均值、标准差和变异系数,判断短期不精密度是否可以接受,然后再进行更多实验。

在 20 天中每天对两个控制品各检测 1 次,估计长期不精密度。计算每个控制品的均值、标准差和变异系数,判断长期不精密度是否可以接受。

问题:

  • 重复性实验需要几个水平或几个材料?
  • 通常至少收集几次检测结果?
  • 最终的重复性实验应当持续多少时间?
  • 如何分析数据以估计不精密度?