- 医学统计学从入门到精通
- 武松 陈道俊
- 1175字
- 2025-03-27 19:10:29
1.1.4 误差
误差(error)就是观察值与真值之差,即我们通过一次试验得到的结果与事件真实结果之间的差值,也可以理解为想获得的值与实际检测到的值之间的差别。误差根据其产生的原因,可以分为以下四种。
1. 系统误差
系统误差(systematic error)是指由试剂未校正或仪器未校准等因素造成的研究结果倾向性的增大或减小。例如,我们路过药房,门口放着一个体重秤,请问我们在称自己的体重之前,要注意的第一件事情是什么呢?有人说先把手上的包放掉;有人说把鞋子脱掉;还有人说看看是不是要收费。但从统计学系统误差的角度分析,我们应该看看体重秤的指针是不是对准零点,如果体重秤本身就有5千克底重,那我们所有人去称,都会重5千克,即发生倾向性的增大。
系统误差的特点:倾向性的增大或减小,“要么不错,要么全错”。但系统误差不可怕,它是可以避免的,如果我们事先进行校准或调零,那么系统误差就可以避免。
2. 随机误差
随机误差(random error)是由各种偶然因素造成的观察值与真值之差。例如,某班级所有同学用同一把尺子测量A同学的身高,结果可以发现,测出的A同学的身高值是不一样的,有高有低。
随机误差的特点:不可以避免,但可以减少。统计学有一个定律叫作“测不准定律”,好像不管你怎么测,就是测不准。那对于重要的指标我们怎么办呢?正如网上流行的一句话“重要的事情说三遍”,对于重要的指标,我们就多测几遍!
3. 抽样误差
抽样误差(sampling error)是由抽样造成的样本统计量与总体参数之间的差异,或是多次抽样的样本统计量之间的差异。有人会说,前面说样本的时候,还说那一勺老母鸡汤的咸淡应该和锅里汤的咸淡是完全一样的啊!
是的,前面的例子是让你明白抽样的思想,而我们科学研究和喝老母鸡汤是不一样的,因为汤里的氯化钠是均匀分布的,而我们医学科学研究的目标事件绝大多数是不均匀分布的。例如,某个班级有120名同学,整体近视眼患病率为50%,如果我们按照随机化原则随机抽取50名同学进行调查,这50名同学的近视眼患病率理论上不会等于50%,因为近视同学在班级中的分布是不均匀的。
因此抽样误差的特点是不可以避免,但可以减少。我们可以通过增大样本量减少抽样误差。可以看图1.2来帮助理解,图中右侧目标事件的分布相对较均匀,而左侧目标事件则呈现明显的聚集性。

图1.2 不均匀分布与均匀分布
4. 过失误差
过失误差(gross error)是指由于观察过程中的不仔细造成的错误判断或记录。过失误差可以通过仔细核对来避免。
统计学的存在主要是解决哪种误差呢?我们通过统计设计来减少系统误差;通过统计学检验去排除抽样误差的影响;随机误差不可避免,但可以通过培训来降低其影响;过失误差可以通过质量控制来消除其影响。
在上面的四种误差中,统计学的假设检验主要是为了控制抽样误差对研究结果的影响,毕竟我们所研究的样本都是从总体中抽样得来的,而抽样必然会发生抽样误差。因此,对抽样样本得到的结果,需要统计检验以排除抽样误差的干扰。