方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
一、标准差:
中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
为非负数值,与测量资料具有相同单位。一个总量的标准差或一个随机变量的标准差,及一个子集合样品数的标准差之间,有所差别。
简单来说,标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
二、标准离差:
多数翻译为标准差,偶尔翻译为标准离差、标准偏差,也称均方差(mean square error)。各数据偏离平均数的距离(离均差)的平均数,它是离均差平方和平均后的方根。用σ表示。因此,标准差也是一种平均数 ;标准离差表示数据的离散程度。
设随机变量ξ的数学期望为Eξ,称(ξ-Eξ)2的数学期望为ξ的方差。它是用来表示随机变量与其数学期望之间离散程度的一个量。对于子样x1,x2,…,x,也类似地定义为它的方差,式中Σ为总计的符号,而这个量也反映了子样的离散程度。
扩展资料
一、离均差平方和
由于误差的不可控性,因此只由两个数据来评判一组数据是不科学的。所以人们在要求更高的领域不使用极差来评判。其实,离散度就是数据偏离平均值的程度。因此将数据与均值之差(我们叫它离均差)加起来就能反映出一个准确的离散程度。和越大离散度也就越大。
但是由于偶然误差是成正态分布的,离均差有正有负,对于大样本离均差的代数和为零的。为了避免正负问题,在数学有上有两种方法:
一种是取绝对值,也就是常说的离均差绝对值之和。
而为了避免符号问题,数学上最常用的是另一种方法——平方,这样就都成了非负数。因此,离均差的平方和成了评价离散度一个指标。
二、方差
由于离均差的平方和与样本个数有关,只能反应相同样本的离散度,而实际工作中做比较很难做到相同的样本,因此为了消除样本个数的影响,增加可比性,将离均差的平方和求平均值,这就是我们所说的方差成了评价离散度的较好指标。
样本量越大越能反映真实的情况,而算术平均值却完全忽略了这个问题,对此统计学上早有考虑,在统计学中样本的均差多是除以自由度(n-1),它的意思是样本能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是n-1。
参考资料:百度百科——标准差
参考资料:百度百科——标准离差
标准差计算公式是标准差σ=方差开平方。标准差,中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。在概率统计中最常使用作为统计分布程度上的测量。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
标准差系数,又称为均方差系数,离散系数。它是从相对角度观察的差异和离散程度,在比较相关事物的差异程度时较之直接比较标准差要好些。
标准差系数是将标准差与相应的平均数对比的结果。标准差和其他变异指标一样,是反映标志变动度的绝对指标。
它的大小,不仅取决于标准值的离差程度,还决定于数列平均水平的高低。因而对于具有不同水平的数列或总体。
就不宜直接用标准差来比较其标志变动度的大小,而需要将标准差与其相应的平均数对比,计算标准差系数,即采用相对数才能进行比较。