统计学中的变量分类是指,统计学简述分类变量与数值变量的根本区别

统计学中的变量分类是指,统计学简述分类变量与数值变量的根本区别,第1张

变量是什么(统计学变量可分为哪几类)

你在学习统计学的时候,可能过于注重分析方法的运用,而忽略了在最好的网络中收集和整理数据的重要性。一般来说,统计分析最重要的一步,其实就是把数据整理成便于分析的数据形式,比如下表:

虽然上表全是数字,但是可以回答很多问题。比如:大家都多大了?什么程度?婚姻状况如何?就业情况怎么样?家里有几口人?

这些问题的答案是我们所考察对象的一系列特征或属性,统计学上称之为变量,即上表第一行的条目名称。统计学初学者一定要训练自己用“变量”来表达自己。

每个被考察的对象称为一个观察单元(案例或观察),变量是观察单元的一些特征或属性。变量的具体值称为“变量值”。

于是,上表中一系列问题对应的变量为:年龄、学历、婚姻状况、就业、家庭规模、ABO血型等。

进一步观察发现,年龄、家庭规模等一些变量的值是具体的、有意义的值;而一些变量的值,如学历、婚姻状况等,虽然用数字表示,但其含义只是一个“代号”,背后需要具体的词语来定义和解释,如“0=未婚,1=已婚”。

因此,年龄、家庭规模等变量的值是定量的、有意义的,我们称之为数量变量

而学历、婚姻状况、就业状况等变量的值是定性的,主要起到代码的作用,它们被称为定性变量。

另一方面,为了对定性变量进行统计处理,往往需要对其进行编码,比如“0代表男性,1代表女性”。所以,在实际的统计工作中,要避免输入汉字,而要注意转换成相应的数字。

甚至是变量名,比如“数字、年龄、学历等。”以上所述,应尽量用英文或汉语拼音表示,以避免统计软件中的错误。

进一步思考会发现,年龄、人口等变量一般都有单位,不同人的年龄差异理论上可以无限小,比如1年、1个月、1天、1小时、0.1小时、0.01小时...

所以,理论上,年龄变量的取值范围可以取任意正实数。注意,它不是正整数。比如一个人的年龄可以记为17.55岁,也就是说年龄是17岁6个月18天。甚至可以利用出生时间的信息精确到更小的时间单位(比如“分、秒”)。所以这类变量被称为连续变量,主要是因为理论上它的取值范围是连续的。

相反,家庭人口的变量是相对于连续变量的另一种,即离散变量。因为不同家族的人口只能相差0,1,2,而不能相差1.1,1.2等。,其取值范围是间歇的、不连续的。

因此,一般只有数量变量才分为连续和离散巴克斯特网,即一个数量变量要么是连续的,要么是离散的。

相比较而言,定性变量虽然在数据表现上类似于离散变量,但一般不被视为离散变量,因为它们只具有“代号”的意义。

另外,定性变量的值往往表现为不相交的类别(所以定性变量也叫分类变量),这些类别有时会有细微的差别。

另一个常见的例子是“满意度”,包括“非常不满意、不满意、一般、满意、非常满意”。这种有序的分类变量给人一种“半定量”的感觉,也称为“等级变量”

相反,另一类定性变量,即无序分类变量,其值并无差异,如性别、血型等。

无序分类变量根据取值不同可分为“二项式分类变量”和“多重分类变量”。比如性别(一般来说,以百特为例。com)只分两类,所以叫两类,而血型很多,可以叫多类。

明确各种变量的含义,还需要明白各种类型的变量是可以转换的。

比如血压一般记录为一个量的变量,但是按照一定的临床标准可以转化为质的变量。比如可以分为:正常血压(收缩压)

本文地址:http://www.mangdie.com/post/50088.html

欢迎分享,转载请注明来源:聚客百科

原文地址: https://juke.outofmemory.cn/life/220320.html

()
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-01
下一篇 2022-06-01

发表评论

登录后才能评论

评论列表(0条)

保存