在统计学中,区分大样本z检验和小样本t检验的主要因素是样本容量的大小。一般而言,样本容量大于30时,可以使用大样本z检验;样本容量小于30时,应使用小样本t检验。
大样本z检验通过假设总体服从正态分布,利用已知的总体参数进行假设检测。它适用于大样本容量,因为随着样本容量的增加,样本均值的抽样分布趋近于正态分布,逼近总体分布。大样本z检验通常用于比较两个样本均值或比较一个样本均值与一个已知的总体均值。
小样本t检验是通过样本数据估计总体参数,然后进行假设检验。它适用于小样本容量,因为当样本容量较小时,样本均值的抽样分布并不服从正态分布。小样本t检验通过假设总体服从正态分布,利用t分布进行假设检测。小样本t检验通常用于比较两个样本均值或比较一个样本均值与一个已知的总体均值。
总之,样本容量的大小是区分大样本z检验和小样本t检验的关键因素。样本容量大于30时,应使用大样本z检验;样本容量小于30时,应使用小样本t检验。
关于以n=30作为区别小样本和大样本的标准,主要是来自于中心极限定理。在学习中心极限定理时,我们知道,不管随机变量的原始分布多古怪,当30个样求和或均值时,其分布已经非常接近正态分布了。所以一般将n>30作为大样本,用正态分布来做近似的计算。当然这要看研究的问题是什么,如果你估计的参数很少,像t分布那样自由度可以达到n-1,30个样应该算是大样本了。但是如果估计的参数很多,比如回归分析,要估计很多个系数,那30个可能就不能称为大样本了。所以具体情况要具体分析,不能一个准则走天下。