我们可以代入期望的数学表达形式。比如连续随机变量:
Var(X)=E[(X−μ)2]=∫+∞−∞(x−μ)2f(x)dx
方差概念背后的逻辑很简单。一个取值与期望值的“距离”用两者差的平方表示。该平方值表示取值与分布中心的偏差程度。平方的最小取值为0。当取值与期望值相同时,此时不离散,平方为0,即“距离”最小;当随机变量偏离期望值时,平方增大。由于取值是随机的,不同取值的概率不同,我们根据概率对该平方进行加权平均,也就获得整体的离散程度——方差。
方差的平方根称为标准差(standard deviation, 简写std)。我们常用σ表示标准差
σ=Var(X)−−−−−−√
标准差也表示分布的离散程度。
正态分布的方差
根据上面的定义,可以算出正态分布
E(X)=1σ2π−−√∫+∞−∞xe−(x−μ)2/2σ2dx
的方差为
Var(X)=σ2
正态分布的标准差正等于正态分布中的参数σ。这正是我们使用字母σ来表示标准差的原因!
excel的标准差函数是:STDEVP函数。
使用STDEVP函数的方法:
1、首先点击选中需要计算标准差的单元格位置,并选择上方的“fx”图标插入函数。
2、在插入函数对话框中输入STDEVP,并在查找到的结果中双击STDEVP开启函数参数设置。
3、在打开的参数设置对话框中选中需要计算标准差的单元格区域,可以根据需要自行选中。
4、点击确定后即可对应生成标准差,针对多组数据可以向下填充公式生成批量的计算结果。
标准差的两种计算公式如下:
std(A):
std(A)函数求解的是最常见的标准差,此时除以的是N-1。
此函数命令不能对矩阵求整体的标准差,只能按照行或者列进行逐个求解标准差,默认情况下是按照列。
在MATLAB主窗口中输入std(A)回车,结果如下:
输出的是每一列的标准差。
std(A,flag):
这里flag代表的是用哪一个标准差函数,如果取0,则代表除以N-1,如果是1代表的是除以N,
我们在MATLAB主窗口中输入std(A,1)回车,std(A,0)。
std(A,flag,dim):
第三个参数代表的是按照列求标准差还是按照行求标准差,std(A,1,1)代表的是按照列求标准差,std(A,1,2)代表的是按照行求标准差。
标准偏差(Std Dev,Standard Deviation) -统计学名词.一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度.标准偏差越小,这些值偏离平均值就越少,反之亦然.标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量.公式
标准偏差公式:S = Sqrt[(∑(xi-x拔)^2) /(N-1)]公式中∑代表总和,x拔代表x的均值,^2代表二次方,Sqrt代表平方根.
例:有一组数字分别是200、50、100、200,求它们的标准偏差.
x拔 = (200+50+100+200)/4 = 550/4 = 137.5
S^2 = [(200-137.5)^2+(50-137.5)^2+(100-137.5)^2+(200-137.5)^2]/3
标准偏差 S = Sqrt(S^2)=75
STDEV基于样本估算标准偏差.标准偏差反映数值相对于平均值 (mean) 的离散程度.
计算步骤
标准偏差的计算步骤是:
步骤一、(每个样本数据 减去 样本全部数据的平均值).
步骤二、把步骤一所得的各个数值的平方相加.
步骤三、把步骤二的结果除以 (n - 1)(“n”指样本数目).
步骤四、从步骤三所得的数值之平方根就是抽样的标准偏差.
标准偏差(标准差)的定义
标准差(Standard Deviation)各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根.用σ表示.因此,标准差也是一种平均数.标准差是方差的算术平方根. 标准差能反映一个数据集的离散程度.平均数相同的,标准差未必相同.
例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67.这两组的平均数都是70,但A组的标准差为17.08分,B组的标准差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多.
标准偏差(Std Dev,Standard Deviation) - 统计学名词.一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度.标准偏差越小,这些值偏离平均值就越少,反之亦然.标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量.