
方差方差和标准差:
样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;
样本方差的算术平方根叫做样本标准差。
样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
数学上一般用E{[X-E(X)]^2}来度量随机变量X与其均值E(X)的偏离程度,称为X的方差。
定义
设X是一个随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记为D(X)或DX。即D(X)=E{[X-E(X)]^2},而σ(X)=D(X)^0.5(与X有相同的量纲)称为标准差或均方差。
由方差的定义可以得到以下常用计算公式:
D(X)=E(X^2)-[E(X)]^2
方差的几个重要性质(设一下各个方差均存在)。
(1)设c是常数,则D(c)=0。
(2)设X是随机变量,c是常数,则有D(cX)=c^2D(X)。
(3)设X,Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)。
(4)D(X)=0的充分必要条件是X以概率为1取常数值c,即P{X=c}=1,其中E(X)=c。
标准差 标准差(Standard Deviation)
各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。用σ表示。因此,标准差也是一种平均数
标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。
例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。 这两组的平均数都是70,但A组的标准差为17.08分,B组的标准差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。
统计学里的标准差可以表示一个数据集合或者一个变量内数值的变动情况。标准差越大,表示数值之间的互相的差异越大,也就表示这些数值不一致的程度越大;反之,则表示数值之间互相之间差异小,数值之间越稳定。
举个例子。两台生产玻璃瓶的机器,为了测量两台机器生产的稳定性能。则每台机器生产100个玻璃瓶,测量每个玻璃瓶的直径。计算每台机器生产的100个玻璃瓶直径的标准差,那台机器生产玻璃瓶的标准差小,代表那台机器生产的稳定性好。