名义数据被标记为变量中互斥的类别。这些类别无法以有意义的方式排序。
例如,首选的交通方式是一个名义变量,因为数据被分类为:汽车、公共汽车、火车、有轨电车、自行车等。
3.3.1. 测量水平
名义数据是最不精确和最复杂的水平。名义这个词的意思是“名义上”,所以这种数据只能被标记。它没有排名顺序、值之间的等间距或真正的零值。
3.3.2. 标称数据示例
在名义水平上,每个响应或观察结果只适合一个类别。
名义数据可以用文字或数字表示。但是,即使数据有数字标签,也无法以有意义的方式对标签进行排序或对它们执行算术运算。
在社会科学研究中,名义变量通常包括性别、婚姻状况、就业状况或学生身份号码。

只能以 2 种方式(例如,是/否或已雇用/未雇用)编码的变量类型称为二元或二分法。由于这些变量中标签的顺序无关紧要,因此它们是名义变量的类型。
3.3.3. 如何收集名义数据
名义数据可以通过开放式或封闭式调查问题收集。
如果感兴趣的变量只有几个可能的标签来捕获所有数据,请使用封闭式问题。

如果感兴趣的变量具有许多可能的标签,或者无法为其生成完整列表的标签,请使用开放式问题。开放式问题示例
- 你的学生证号码是什么?
- 您的邮政编码是什么?
- 你的职业是什么?
3.3.4. 如何分析名义数据
要分析名义数据,研究人员可以在表格和图表中组织和可视化数据。
然后,研究人员可以收集一些有关数据集的描述性统计信息。这些可帮助评估频率分布并找到数据的集中趋势。但并非所有集中趋势或可变性的衡量标准都适用于名义数据。
示例:名义数据集
研究人员分发了一个带有问题的调查,要求受访者从列表中选择他们的职业状况。数据集是响应值的列表。

分布
要分析此数据集,研究人员可以创建一个频率分布表,以显示每个职业的响应数量和百分比分布。

对于此数据集,也可用图形进行描述,如柱状图或饼图。


集中趋势
数据集的中心趋势告诉数据中大部分值的位置。
众数、均值和中位数是集中趋势的三种最常用的度量。但是,只有众数可以用于名义数据描述集中趋势。
要获得数据集的中位数,研究人员必须能够从低到高对值进行排序。对于平均值,研究人员需要能够对数据集中的值执行算术运算,例如加法和除法。虽然名义数据可以按类别分组,但不能排序或汇总。
因此,名义数据的集中趋势只能用众数来表示,众数是最频繁重复的值。
示例:众数mode
要查找名义数据集的众数,则可在频率分布表查找最常出现的值。
在职业中,中层管理人员比例最高,因此,职业的众数为中层管理人员。
名义数据的统计检验
推论统计可帮助研究人员检验有关数据的科学假设。非参数统计检验用于名义数据。
虽然参数统计检验需假设数据集的某些特征,例如分数的正态分布,但这些不适用于名义数据,因为数据无法以任何有意义的方式排序。
卡方检验是类别变量的非参数统计检验。拟合优度卡方检验可用于具有一个变量的数据集,而独立性卡方检验可用于具有两个变量的数据集。
当通过随机抽样从单个总体收集数据时,将使用拟合卡方优度检验。要衡量样本的代表性,您可以使用此测试来评估样本的频率分布是否符合您对更广泛人群的期望。
示例:拟合优度的卡方检验
根据当前人口数据,研究人员预计 10% 的样本被认定为企业高层管理人员,30% 被认定为中层管理人员,40% 被认定为一般职业。相反,研究人员观察到的数据显示,48% 的样本是企业高层管理人员,33% 是中层管理人员,19% 是一般职业。
拟合优度检验统计量反映的是观察到的与偶然预期的差异有多大。如果检验统计量为零,则预期值与观测值之间没有差异。
通过独立性卡方检验,研究人员可以确定两个类别变量之间的关系是否具有统计显著性。
示例:独立卡方检验
独立性卡方检验如果收集有关每个参与者的职业状况和婚姻的数据,则可以测试样本中的两个变量之间是否存在关系。使用假设检验,可以正式评估单个样本中的两个名义变量是否相互独立。