什么是正态分布

什么是正态分布,第1张

目录 1正态分布 目录 1正态分布 收起 编辑本段正态分布 normal distribution

一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

正态分布最早由A棣莫弗在求二项分布的渐近公式中得到。CF高斯在研究测量误差时从另一个角度导出了它。PS拉普拉斯和高斯研究了它的性质。

生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。

正态分布

1正态分布

若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号 ~ 。其中μ、σ2 是两个不确定常数,是正态分布的参数,不同的 、不同的 对应不同的正态分布。

正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。

2.正态分布的特征

服从正态分布的变量的频数分布由 、 完全决定。

(1) 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于 。

(2) 描述正态分布资料数据分布的离散程度, 越大,数据分布越分散, 越小,数据分布越集中。 也称为是正态分布的形状参数, 越大,曲线越扁平,反之, 越小,曲线越瘦高。

标准正态分布standard normal distribution

1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ2为0和1,通常用 (或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。

2.标准化变换:此变换有特性:若原分布服从正态分布 ,则Z=(x-μ)/σ ~ N(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。

3 标准正态分布表

标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例 。

正态曲线下面积分布

1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范围内正态曲线下的面积可用公式计算。

2几个重要的面积比例

轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为6827%,横轴区间(μ-196σ,μ+196σ)内的面积为9500%,横轴区间(μ-258σ,μ+258σ)内的面积为9900%。

正态分布的应用

某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

1 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

2 制定参考值范围

(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

(2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。

3 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

4 正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

研究过程

正态分布的概念和特征一、正态分布的概念

由一般分布的频数表资料所绘制的直方图,图(1)可以看出,高峰位于中部,左右两侧大致对称。我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图(3)。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。

  为了应用方便,常对正态分布变量X作变量变换。

该变换使原来的正态分布转化为标准正态分布 (standard normal distribution),亦称u分布。u被称为标准正态变量或标准正态离差(standard normal deviate)。

二、正态分布的特征:

1.正态曲线(normal curve)在横轴上方均数处最高。

2.正态分布以均数为中心,左右对称。

3.正态分布有两个参数,即均数μ和标准差σ。μ是位置参数,当σ固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动。σ是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭。通常用N~(μ,σ2)表示均数为μ,方差为σ2的正态分布。用N(0,1)表示标准正态分布。

4.正态曲线下面积的分布有一定规律。

实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。

查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式u=(X-μ)/σ求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数X1和标准差S分别代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-196)与区间(196,∞)的面积相等,④曲线下横轴上的总面积为100%或1。

图2 正态曲线与标准正态曲线的面积分布

第二节 正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。

1.估计正态分布资料的频数分布

例110 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=17270cm,标准差s=401cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-196s、X+-258s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。

本例,μ、σ未知但样本含量n较大,按式(31)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-17270)/401=-117。查附表标准正态曲线下的面积,在表的左侧找到-11,表的上方找到007,两者相交处为01210=1210%。该地18岁男大学生身高在168cm以下者,约占总数1210%。其它计算结果见表3。

表3 100名18岁男大学生身高的实际分布与理论分布

分布

x+-s

身高范围(cm)

实际分布

人数

实际分布

百分数(%)

理论分布(%)

X+-1s

16869~17671

6767006827

X +-196s16484~18056

9595009500

X+-258s16235~18305

9999009900

2.制定医学参考值范围:亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:

(1)正态分布法:适用于正态或近似正态分布的资料。

双侧界值:X+-u(u)^S单侧上界:X+u(u)^S,或单侧下界:X-u(u)^S

(2)对数正态分布法:适用于对数正态分布资料。

双侧界值:lg-1[X(lgx)+-u(u)S(lgx)];单侧上界:lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。

常用u值可根据要求由表4查出。

(3)百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。

双侧界值:P25和P975;单侧上界:P95,或单侧下界:P5。

表4常用u值表

参考值范围(%)单侧双侧800842

1282

901282

164595164519609923262576

3.正态分布是许多统计方法的理论基础:如t分布、F分布、x2分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。

一阶导函数是表示变化率的,结合题主的问题,这里的意思就是正态分布的密度函数值在均值±一个标准差处前后会发生一个剧变,因为这一范围其实已经包含了65.44%的情况,而到了均值加减两个标准差就直接包含了超过95%,

可以和密度曲线比较一下看一看(在均值±一个标准差之内曲线变化速度较慢,是往外凸的;而这两点之外,曲线变化速度非常快,是往里面凹进去的,类似于小球滚下坡时的最速下降曲线)。

扩展资料

图形特征

集中性:正态曲线的高峰位于正中央,即均数所在的位置。

对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。

正态分布加一个常数,还是符合正态分布,只是期望值加上了这个常数。

N(0,σ²)+C ~ N(C,σ²)。

一个随机变量符合正态分布,我们可以画出其函数图像,让其每个数都加上一个常数,只会让函数图像左右平移,那么只会改变期望值,仍然符合正态分布,甚至标准差都没有改变。

扩展资料:

一、正态分布的一些性质:

1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。

2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。

4、关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。

二、正态分布曲线应用

1、估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

2、质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

3、正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

参考资料来源:百度百科-正态分布

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A棣莫弗在求二项分布的渐近公式中得到。CF高斯在研究测量误差时从另一个角度导出了它。PS拉普拉斯和高斯研究了它的性质。[1] 是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

1正态分布:若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号 ~ 。其中μ、σ^2 是两个不确定常数,是正态分布的参数,不同的μ、不同的σ^2对应不同的正态分布。 正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。 2.正态分布的特征:服从正态分布的变量的频数分布由μ、σ完全决定。 (1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。 (2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。 也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

正态曲线下面积分布

1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范围内正态曲线下的面积可用公式计算。 2几个重要的面积比例 轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68268949%,横轴区间(μ-196σ,μ+196σ)内的面积为95449974%,横轴区间(μ-258σ,μ+258σ)内的面积为99730020%。

标准正态曲线

1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ^2为0和1,通常用ξ(或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。 2.标准化变换:此变换有特性:若原分布服从正态分布 ,则Z=(x-μ)/σ ~ N(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。 3 标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例 。

一般正态分布与标准正态分布的转化

由于一般的正态总体 其图像不一定关于y轴对称,对于任一正态总体 ,其取值小于x的概率 。只要会用它求正态总体 在某个特定区间的概率即可。 “小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。

一般正态分布与标准正态分布的区别与联系

正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都可以通过Z分数公式转换成标准正态分布。 两者特点比较: (1)正态分布的形式是对称的,对称轴是经过平均数点的垂线。 (2)中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。 (3)正态曲线下的面积为1。正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。 (4)正态分布曲线下标准差与概率面积有固定数量关系。所有正态分布都可以通过Z分数公式转换成标准正态分布。 主要特征 1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。 2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。 4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。 5、u变换:为了便于描述和应用,常将正态变量作数据转换。 3σ原则 正态分布曲线性质:1当x<μ时,曲线上升;当x>μ时,曲线下降。当曲线向左右两边无限延伸时,以x轴为渐近线。2正态曲线关于直线x=μ对称。3σ越大,正态曲线越扁平;σ越小,正态曲线越尖陡。4在正态曲线下方和x轴上方范围内区域面积为1。3σ原则:P(μ-σ<X≤μ-σ)=683%P(μ-2σ<X≤μ-2σ)=954%P(μ-3σ<X≤μ-3σ)=997%

正态分布具有一个很重要的性质:再生性。

就是说。如果X~N(θ1,σ1^2),Y~N(θ2,σ2^2)

那么ax+by+c~N(aθ1+bθ2+c,a^2σ1^2+b^2σ2^2)

那么对于本题

2X+Y服从N(22+1(-3) 2^2σ^2+1^2σ^2)

即N(1,5σ^2)

2X-Y+1服从N(22-1(-3)+1 2^2σ^2+1^2σ^2)

即N(8 5σ^2)

服从正态分布的变量的频数分布由μ、σ完全决定。

集中性:正态曲线的高峰位于正中央,即均数所在的位置。对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ2):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。

u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。

σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

面积分布

1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范围内正态曲线下的面积可用公式计算。

⒉几个重要的面积比例轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68268949%,横轴区间(μ-196σ,μ+196σ)内的面积为95449974%,横轴区间(μ-258σ,μ+258σ)内的面积为99730020%。

以上就是关于什么是正态分布全部的内容,包括:什么是正态分布、正态分布简单性质、考研数学概率论 :正态分布加常数还是服从正态分布等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:聚客百科

原文地址: http://juke.outofmemory.cn/life/3854704.html

()
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-09
下一篇 2023-05-09

发表评论

登录后才能评论

评论列表(0条)

保存