设 X1,X2, …, Xn是取自总体X的样本,X(i) 称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值。
所谓次序统计量,针对的是从总体中挑选n个样本的概念。
比如,X可取0,1,2。则当n=3时,可以知道共有27种可能性。将其从大到小排序,结果可能只有9种情况。所谓X(2)表示排序后第2个数取值的可能性。X(2)=0,1,2,相加肯定为1。
如果可以包含一个样本的所有信息,那么这个统计量,直白的来说就可以代替这个样本中的所有数据,从某种意义上来说也是一种降维。这也是为什么充分统计量具有非常大的统计学上的意义。
若给定统计量的值,样本联合密度的条件分布与未知参数无关,则这个统计量为充分统计量。
顺序统计量
设 X1,X2, …, Xn是取自总体X的样本,X(i) 称为该样本的第i个次序统计量,从小到大排序为x(1),x(2), …,x(n),则称X(1),X(2), …,X(n)为顺序统计量。
顺序统计量,别称是变量序列,亦称变列分布函数。数理统计中的一种常用统计量。将样本观测值由小到大排列得到的统计量。
以上内容参考:次序统计量 - 百度百科
顺序统计量在近代统计推断中起着重要的作用,这是由于有一些性质不依赖于母体的分布,而且计算量很小,使用起来较方便,因此在质量管理、可靠性等方面得到广泛的应用。求离散型随机变量
的顺序统计量的分布比较容易,本文就
连续型随机变量
略加探讨,为方便起见,假设随机变量X是连续型随机变量。
一、基本概念
定义:设X1,…,Xn是来自某总体的一个样本,该样本的第i个顺序统计量,记为X(i),它是如下的样本函数,每当该样本得到一组
观测值
x1,…xn,时,将它们从小到大排列为x(1)≤x(2)≤…≤x(n)其中第i个值x(i)就是X(i)的观测值。称(X1,…,Xn)为该样本的顺序统计量,X1称为该样本的最小顺序统计量,Xn称为该样本的最大顺序统计量。
二、主要命题
在总体有密度函数p(x)场合,各种顺序统计量的密度函数都容易用“概率元”方法导出。大家知道,连续型随机变量落在很小区间(x,x+dx)内的概率为P(x#65533X≤x+dx)=p(x)d+o(dx)
其中o(dx)是比dx高阶的
无穷小量
,所以p(x)dx是左端概率的主要部分,称为是X的概率元。反之,若存在函数p(x)使上式成立,则p(x)就是X的密度函数。此种寻求密度函数方法称为“概率元方法”。这个方法在多维联合密度场合也适用,下面概率元方法来寻求各种顺序统计量的密度函数。
设X1,…,Xn是来自某总体的一个样本,该总体的
分布函数
为F(x),密度函数为p(x),该样本的顺序统计量为X(1)≤…X(n),它们的观测值依次记为y1≤…≤y(n),X(k)的密度函数g(yk),其中1≤k≤n,X(k)的观测值为yk,以yk为基础把
实数轴
分为三个区间:(-∞,yk),[yk,yk+dyk),[yk+dyk,∞)。
特别,X1与Xn的密度函数分布为
g(y1)=n[1-F(y1)]n-1p(y1)(2)
g(yn)=n[F(yn)]n-1p(yn)(3)
三、应用
例.设
电子元件
的寿命X服从参数为θ=0.0015的
指数分布
。测试了6个元件,分别记录它们失效的时间(单位:h)。试求(1)至800h时,没有一个元件失效的概率(2)至3000h时,所有元件都失效的概率。
解:X的
概率密度函数
和分布函数分别为
f(x)=0.0015e-0.0015x,x00,x≤0
F(x)=1-e-0.0015x,x00,x≤0
(1)由式(2),极小顺序统计量X(1)的概率密度函数和分布函数分别为
f1(x)=0.009e-0.009x,x00,x≤0
F1(x)=1-e-0.009x,x00,x≤0
至800h没有一个元件失效的概率为
p(X(1)800)=1-F1(800)=1-(1-e-0.009(800))=e-7.2
(2)由式(3),极大顺序统计量X(6)的概率密度函数和分布函数分别为
f6(x)=0.009e-0.0015x(1-e-0.0015x)5,x00,x≤0
F6(x)=(1-e-0.0015x)6,x00,x≤0
至3000h时,所有元件都失效的概率为
P(X(6)lt3000)=F6(3000)=(1-e-4.5)6