描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
统计描述,就是用统计的方法对数据进行一定的汇总。提到统计描述,不得不提统计推断,何谓统计推断呢,就是用概率论的方法对数据间的差异“是否有统计学意义”进行一定的推断。
描述统计中的数据可以分为分类型数据和数值型数据。分类型数据是识别变量的类型,比如男女、地区、各种类别;数值型数据是表示数值的大小和多少,比如年龄中的18、19、20岁。
最明显的区分是,分类型数据不能使用加减法,而数值型数据可以。两者在一定程度可以互相转换。比如年龄,18岁是数值型数据,但它也可以转换成分类数据青少年。
扩展资料
描述统计中数据的度量
1、平均数是一种数据位置的度量,用以了解整体数据,这是小学就学到的内容。可是平均数并不是一个权威的衡量指标,当我们提到全国平均工资的时候,我们都是被马云爸爸王健林爸爸平均的普通人。
平均数容易受到极值的影响,因为数据集并不能保证,各类运营数据经常受到扰动,比如薅羊毛党就会拉高营销活动的平均值。一般而言,可以用调整平均数(trimmed mean)消除异常波动,在数据集中删除一定比例的极大值和极小值,比如5%,然后重新计算平均数。
2、中位数。将所有数据按升序排列后,位于中间的数值即中位数。当数据集是奇数,中位数是中间的数值,当数据集是偶数,中位数是中间两个数的平均值。
3、另外一种度量是众数,它是数据集出现频次最多的数据,当有多个众数时,称为多众数。众数使用的频率低于前两者,更多用于分类数据。
4、数据分析师常将数据划分为四个部分,每一部分包含25%的数据集,划分的分割点叫做四分位数。依次将数据升序排列,位于第25%位置的叫做第一四分位数Q1,位于第50%位置的叫做第二四分位数Q2,即中位数,位于第75%的叫做第三分位数Q3。这三个点,能辅助衡量数据的分布状态。
参考资料来源:百度百科-描述统计
描述统计学名词解释:统计学的一部分。统计分析初始阶段的各种方法的统称。主要研究如何对搜集到的数据进行既能描述该组数据全貌,又能反映所要研究现象的内容和本质的各种简缩数据的方法。
内容包括统计分组,编制统计表,绘制统计图,计算各种统计量,如算术平均数、中数、众数、几何平均数、调和平均数等表示数据集中趋势或代表值的一些统计量;标准差、平均差、四分差、相对差异量数等表示数据离中趋势或分散程度的一些统计量。
表示两列或多列变量之间相关程度的各种相关量数;表示变量之间变化的数量关系的回归系数,以及一些表示分布状态的特征值等。
为了对资料的全局做到心中有数,资料库就要研究开展有用的统计工作,即资料统计,从而促进资料的广泛积累、搜集等。
其工作有如下几种:数量统计;保管状况统计;鉴定情况统计;利用情况统计;供应情况统计;资料复制情况统计。有的资料库为总结全年工作和向所属管理机关汇报工作,需要编制资料年度综合情况统计表,其主要统计项目有:资料库名称、资料数量和。
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。集中趋势分析
集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如被试的平均成绩多少?是正偏分布还是负偏分布?
离中趋势分析
离中趋势分析主要靠全距、四分差、平均差、方差、标准差等统计指标来研究数据的离中趋势。例如,我们想知道两个教学班的语文成绩中,哪个班级内的成绩分布更分散,就可以用两个班级的四分差或百分点来比较。
相关分析
相
关分析探讨数据之间是否具有统计学上的关联性。这种关系既包括两个数据之间的单一相关关系——如年龄与个人领域空间之间的关系,也包括多个数据之间的多重
相关关系——如年龄、抑郁症发生率、个人领域空间之间的关系;既包括A大B就大(小),A小B就小(大)的直线相关关系,也可以是复杂相关关系
(A=Y-B*X);既可以是A、B变量同时增大这种正相关关系,也可以是A变量增大时B变量减小这种负相关,还包括两变量共同变化的紧密程度——即相关
系数。实际上,相关关系唯一不研究的数据关系,就是数据协同变化的内在根据——即因果关系。获得相关系数有什么用呢?简而言之,有了相关系数,就可以根据回归方程,进行A变量到B变量的估算,这就是所谓的回归分析,因此,相关分析是一种完整的统计研究方法,它贯穿于提出假设,数据研究,数据分析,数据研究的始终。
例如,我们想知道对监狱情景进行什么改造,可以降低囚徒的暴力倾向。我们就需要将不同的囚舍颜色基调、囚舍绿化程度、囚室人口密度、放风时间、探视时间进行排列组合,
然后让每个囚室一种实验处理,然后用因素分析法找出与囚徒暴力倾向的相关系数最高的因素。假定这一因素为囚室人口密度,我们又要将被试随机分入不同人口密
度的十几个囚室中生活,继而得到人口密度和暴力倾向两组变量(即我们讨论过的A、B两列变量)。然后,我们将人口密度排入X轴,将暴力倾向分排入Y轴,获
得了一个很有价值的图表,当某典狱长想知道,某囚舍扩建到N人/间囚室,暴力倾向能降低多少。我们可以当前人口密度和改建后人口密度带入相应的回归方程,算出扩建前的预期暴力倾向和扩建后的预期暴力倾向,两数据之差即典狱长想知道的结果。
推论统计
推论统计是统计学乃至于心理统计学中较为年轻的一部分内容。它以统计结果为依据,来证明或推翻某个命题。具体来说,就是通过分析样本与样本分布的差异,来估算样本与总体、同一样本的前后测成绩差异,样本与样本的成绩差距、总体与总体的成绩差距是否具有显著性差异。
例如,我们想研究教育背景是否会影响人的智力测验成绩。可以找一100名24岁大学毕业生和100名24岁初中毕业生。采集他们的一些智力测验成绩。用推
论统计方法进行数据处理,最后会得出类似这样儿的结论:“研究发现,大学毕业生组的成绩显著高于初中毕业生组的成绩,二者在.01水平上具有显著性差异,
说明大学毕业生的一些智力测验成绩优于中学毕业生组。”
其中,如果用EXCEL 来求描述统计。其方法是:
工具-加载宏-勾选"分析工具库"
然后关闭Excel然后重新打开,
工具菜单就会出现"数据分析"
描述统计是“数据分析”内一个子菜单
在做的时候,记得要把方格输入正确。最好直接点选