估计标准误差是实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。统计上定义剩余误差除以自由度n – 2所得之商的平方根为估计标准误。
在回归分析中,估计标准误差越小,表明实际值越紧靠估计值,回归模型拟合优度越好;
反之,估计标准误差越大,则说明实际值对估计值越分散,回归模型拟合越差;
估计标准误差在回归分析中仍然是一个重要的指标,因为它还是用自变量估计因变量时确定置信区间的尺度。
这是一个变量的SEE的计算公式:
分子是计算样本观测实际值与预测值之间的差异,称为回归残差(regression residual,ε),通常是指误差项error term.求平方后,可以叫做剩余平方和。
整个公式与计算标准差的公式非常像,除了分母由n-1变为n-2之外,在计算SEE中,n-2是指自由度(degrees of freedom),因为一共有n个观察值,而两个估计的参数,b0的估计、b1的估计占了2个,因此整个公式只有n-2个自由度了。
估计标准误差 :实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系.因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度.统计上定义剩余误差除以自由度n – 2所得之商的平方根为估计标准误.:
其公式为
(5.10)
式中:为估计标准误差,n-2是自由度.
在回归分析中,估计标准误差越小,表明实际值越紧靠估计值,回归模型拟合优度越好;反之,估计标准误差越大,则说明实际值对估计值越分散,回归模型拟合越差.
实际工作中也可用下列简捷公式 (5.11)
以例题2计算:
(万元) 或
作为回归模型拟合优度的判断和评价指标,估计标准误显然不如判定系数r2.r2 是无量纲系数,有确定的取值范围 (0—1),便于对不同资料回归模型拟合优度进行比较;而估计标准误差是有计量单位的,又没有确定的取值范围,不便于对不同资料回归模型拟合优度进行比较.
但是,估计标准误差在回归分析中仍然是一个重要的指标,因为它还是用自变量估计因变量时确定置信区间的尺度,用X对Y进行估计的置信区间为:
(5.12)
因此,可以推断有68.27%的Y落在Y±1SXY以内,有95.45%的Y落在Y±2SXY以内,有99.73%的Y落在Y±3SXY以内.这是在大样本条件下的区间估计.如果样本n
设n个测量值的误差为e1、e2……en,则这组测量值的标准误差σ等于:其中,e
=
xi
−
t,式中:e-误差;xi-测定值;t-真实值。
由于被测量的真值是未知数,各测量值的误差也都不知道,因此不能按上式求得标准误差。测量时能够得到的是算术平均值,它最接近真值(n),而且也容易算出测量值和算术平均值之差,称为残差(记为v)。理论分析表明可以用残差v表示有限次(n次)观测中的某一次测量结果的标准误差σ,其计算公式为:
对于一组等精度测量(n次测量)数据的算术平均值,其误差应该更小些。理论分析表明,它的算术平均值的标准误差。有的书中或计算器上用符号s表示):