方差越大说明数据越偏离数据的平均值,也就是说数据是飘忽不定的。
方差是衡量源数据和期望值相差的度量值。
统计中的方差是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。找到一组数据的平均值,方差是这组数据整体偏离平均值的程度。
特点:
要是放在散点图上,点都聚在平均值旁边的话,方差就小。
在统计描述中,方差用来计算每一个变量(观察值)与总体均数之间的差异。为避免出现离均差总和为零,离均差平方和受样本含量的影响,统计学采用平均离均差平方和来描述变量的变异程度。
设X为随机变量,X1,X2,...Xi,...,Xn为其n个样本,DX为方差。
根据方差的性质,有D(X+Y)=DX+DY,以及D(kX)=k^2*DX,其中X和Y相互独立,k为常数。
于是D(ΣXi/n)=ΣD(Xi)/(n^2)=DX/n
扩展资料
当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。
样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S表示。方差相应的计算公式为:
标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准差。
方差与平均数并没实质的联系,当然一般来说计算方差时要用到平均数(现多称作期望)。比较稳定性,与平均数是没有关系的,只与方差有关,方差越大,稳定性越差。方差越小,稳定性越高。
整组数据集体加上一个数字a,那么平均值为原值加上a,方差不变,集体乘以一个数字a,那么平均值为原值乘以a,方乘以a²,所以这里得到平均数、方差、标准差。
方差的变化规律
样本同时乘以或除以一个数,方差乘以或除以该数的平方,平均数乘以或除以这个数,标准差乘以或除以这个数。
样本同时加上或减去一个数,方差不变,平均数加上或减去这个数,标准差不变。
样本同时乘以一个数a,然后在加上一个数b,方差乘以a的平方,平均数加上b,标准差乘以a。