前言
做数据分析的时候,相信大多数人会纠结于,到底该用什么样的数据指标,去描述数据的某一特征?该用什么样的方法,对数据进行精准的分类?毫无疑问,在正确的数据类型上,运用正确的指标,将为后续的数据决策与数据挖掘,奠定坚实的基础。接下来,小编将会从数据描述的三种维度,和数据结构的四种分类,为大家详细讲解。

数据结构的四种分类
在生活中工作中,可以用数值表示事物所具有的特征,往往称之为数据。实际工作中的数据,少则上千条,多则上万条,甚至上亿条。面对如此庞大的数据集,我们往往无法一一过目。所以借助类似算术平均值、中位数、频率等指标,去对庞大的整体数据进行间接观测,将变得势在必行。但是,并不是所有的指标都可以适用于所有的数据。进一步来讲,往往需要正确的识别数据的结构,才能选择正确的数据指标,为下一步的数据挖掘、预测、决策等目的顺利进行提供保障。
定类数据:可以分类
定类数据,是生活中最常见的一类数据。当某一事物的某一个特征,可以被数字化时,是否可以分类,将可以非常明显的判断。尤其需要注意的是,定类数据的类与类之间是不具有顺序的。如果具有顺序,他将会升级为定序数据。

商家销售记录
定序数据:可以排序
定序数据,就是在定类数据的基础上,可以排序的数据。尤其,它与定距数据要进行区别。定序数据,专门指一类,只可以进行排序而不可以进行加减的数据,例如,从a到z的字母表。按照字母表顺序,我们可以定义c>a,但是a与c进行加减是没有意义的。

月-星期步数热图
定距数据:数据离散,可以加减
定距数据。就是在定序数据的基础上,可以进行加减的数据。但是,特别需要注意的是,定距数据依然是离散数据,而非连续数据。也正因为定距数据的离散结构,我们无法对其进行乘除法。因为在乘除法的过程中,一定会产生连续小数。而当我们描述非洲草原上,奔跑的象群中大象数量的时候,共有25.5头大象在奔跑,我想,这一定是一个非常滑稽的数据。

定比数据:数据连续,可以乘除
定比数据,不仅具有定距数据的特征,而且与定距数据最大的不同就是,定比数据连续且可以乘除。可以说,定比数据,是数据结构上最为完善的一种数据。金钱、重量、摄氏度等生活中常见的数据特征,都可以被形容为定比数据。同时,我们也把对定类数据和定序数据的分析称为定性分析,把对定距数据和定比数据的分析称为定量分析。

定比数据描述
数据描述的三种维度
数据的集中趋势描述
数据的集中趋势,是反映事物数据集合,目前所处的位置和发展水平的代表值或中心值。通过对事物集中趋势指标的多次测量和比较,还能够说明事物的发展和变化趋势。例如,国家经济发展水平人均GDP,就是一个集中趋势指标。尽管,每个人的能力和对国家的贡献不同,反映在个人GDP的不同之上。但是,人均GDP,当然可以非常有效地作为衡量一个国家是否国富民强的关键指标。
主要指标包括:算术平均值,加权平均值,几何平均值,众数,中位数等。
数据的离散程度描述
数据的离散程度,可以反映出数据整体,在代表值和中心值为基础的数据整体发展水平中,上下波动的趋势。我们可以设想,如果有两个数据集a和b,他们的算术平均值相同,那么在数据的集中趋势描述之上,将很难去进行数据决策。但是,如果发现b数据集,在数据的离散程度描述之上,明显更大,相比于数据集a明显数据特征更加不稳定。那么,我们将很容易进行数据决策,选择离散程度较小的数据集a。从而可见,数据的离散程度描述,对于在数据的集中趋势描述之上,进一步补充数据描述的重要性。
主要指标包括:总体方差和标准差,样本方差和标准差,极差,平均偏差等。
数据的分布形态描述
在我们已知数据的发展水平,以及发展水平上下离散程度情况之后。我们更关心的事实,是在数据集中,哪一部分数据显著地造成了离散程度,哪一部分数据主要地促成了发展水平等问题。我们迫切地想要讨论,出现的中心值和离散程度的主要原因。此时,数据的分布形态描述将尤为重要。数据的分布形态描述,主要依靠数据频度图来表示。而,频度图只能表示数据结构为离散形态的种类,数据结构为连续形态的种类将无法表示。但是,根据辛钦大数定律,频率的稳定值为概率。换而言之,在数据量足够大的情况下,数据的频率等于概率。所以我们可以用概率密度函数。来描述连续结构数据的频度分布情况。由正态分布与二项分布图中,可以轻易地显示出,离散频度与连续"频度"间的差异与相同点。

销售金额频度图

正态分布与二项分布
总结
综上所述,大家在工作中,可以针对不同的数据特点,对数据结构四种类型,和数据描述的三个维度,进行识别和区分的前提下,挑选正确的统计指标,是后续分析决策开展的关键一步。为此,小侠特整理以下表格供大家参考选择。注意,表格中有红色字样标注的众数,表示在定比数据结构中,集中趋势的众数指标,有时可以,有时不可以,要针对实际情况做出选择。

转载请告知作者,并注明来源。如有错误, 请及时告知作者, 必将及时改正, 尊重客观事实。邮箱:784030774@qq.com
如果大家喜欢,请给小侠一个点赞、关注[呲牙]