单因素多元方差分析
(1)单因素多元方差分析的MATLAB实现
MATLAB统计工具箱中提供了manoval函数,用来做单因素多元方差分析,检验多个多元正态总体是否具有相同的均值向量。调用格式如下:
<1>d=manova1(X,group)
根据样本观测值矩阵X进行单因素多元方差分析,比较X中的各组观测是否具有相同的均值向量,原假设是各组的组均值是相同的多元向量。样本观测值矩阵X是一个mxn的矩阵,它的每一列对应一个变量,每一行对应一个观测,每一个观测都是n元的。输入参数group是一个分组变量,用来标示X中的每个观测所在的组,group可以是一个分类变量、向量、字符串数组或字符串元胞数组,group的长度应该与X的行数相等,group中相同元素对应的X中的观测来自同一个总体(组)的样本。
各组的均值向量生成了一个向量空间,输出参数d是这个空间维数的估计,当d=0时,接受原假设,当d=1时在显著性水平0.05下,拒绝原假设,认为各组的组均值不全相同,但是不能拒绝他们贡献的假设;当d=2时,拒绝原假设,此时各组的组均值可能共面,但是不共线。
<2>d=manova1(X,group,alpha)
指定检验的显著性水平。返回的d是满足p>alpha的最小维数,其中p是检验的p值,此时检验各组的均值向量是否位于一个d维空间。
<3>[d,p]=manova1(......)
还返回检验的p值向量,它的第i个元素对应的原假设是:各组的均值向量位于一个i-1维空间,若p的第i个元素小于或等于给定的显著性水平,则拒绝这样的原假设。
<4>[d,p,stats]=manova1(......)
还返回一个结构体变量stats。
(2)例:
为了研究销售方式对商品的销售额的影响,选择四种商品(甲,乙,丙和丁)按三种不同的销售方式(1,2,和3)进行销售。这四种商品的销售额分别记为x1,x2,x3,x4,其数据如下表

根据这些数据分析不同销售方式对销售额是否有显著影响,显著性水平为0.05.
下面调用manova1函数作单因素多元方差分析。
%从文件销售.xls中读取数据
xdata=xlsread('销售.xls');
%提取xdata的第2-5列和第8-11列,即四种商品的销售额数据
x=[xdata(:,2:5);xdata(:,8:11)];
%提取xdata的列6列和第12列,即销售方式数据
group=[xdata(:,6);xdata(:,12)];
%调用manova1函数作多元方差分析
[d,p,stats]=manova1(x,group)
d =
1
p =
0.0040
0.0917
stats =
W: [4x4 double]
B: [4x4 double]
T: [4x4 double]
dfW: 57
dfB: 2
dfT: 59
lambda: [2x1 double]
chisq: [2x1 double]
chisqdf: [2x1 double]
eigenval: [4x1 double]
eigenvec: [4x4 double]
canon: [60x4 double]
mdist: [60x1 double]
gmdist: [3x3 double]
gnames: {3x1 cell}
从manova1函数返回的结果来看,p值分别为0.004<0.05和0.0917>0.05,说明在显著性水平0.05下拒绝假设:3种销售方式所对应的销量的均值向量都相同,接受假设:3种销售方式多对应的销售量的均值向量位于一个1维空间(即共线),因此维数的估计值为d=1。总的来说,在显著性水平0.05下,可认为不同销售方式对销售额有显著影响,但是究竟对四种商品中的哪种商品的销售额影响最显著,还需要对四种商品的销售额分别做一元方差分析。
%调用anova1函数对甲商品的销售额作一元方差分析
[p1,table]=anova1(x(:,1),group)
%调用anova1函数对乙商品的销售额作一元方差分析
[p2,table2]=anova1(x(:,2),group)
%调用anova1函数对丙商品的销售额作一元方差分析
[p3,table3]=anova1(x(:,3),group)
%调用anova1函数对丁商品的销售额作一元方差分析
[p4,table4]=anova1(x(:,4),group)
p1 =
0.0411
table =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'
'Groups' [5.2213e+03] [ 2] [2.6106e+03] [3.3766] [0.0411]
'Error' [4.4070e+04] [57] [ 773.1500] [] []
'Total' [4.9291e+04] [59] [] [] []
p2 =
0.2078
table2 =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'
'Groups' [ 518.5333] [ 2] [259.2667] [1.6154] [0.2078]
'Error' [9.1481e+03] [57] [160.4921] [] []
'Total' [9.6666e+03] [59] [] [] []
p3 =
0.8478
table3 =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'
'Groups' [2.4808e+03] [ 2] [1.2404e+03] [0.1656] [0.8478]
'Error' [4.2703e+05] [57] [7.4917e+03] [] []
'Total' [4.2951e+05] [59] [] [] []
p4 =
8.6070e-04
table4 =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'
'Groups' [3.8529e+04] [ 2] [1.9265e+04] [8.0085] [8.6070e-04]
'Error' [1.3712e+05] [57] [2.4055e+03] [] []
'Total' [1.7564e+05] [59] [] [] []
对四种商品的销售额分别做了一元方差分析,得到的检验p值分别为:p1<0.05, p2>0.05,p3<0.05,p4>0.05,所以在显著性水平0.05下,可认为不同销售方式对甲商品的销售额有显著影响,对丁商品的销售额有十分显著的影响,对乙和丙商品的销售额没有显著影响。