matlab多因素方差分析 (matlab多因素方差分析解题思路)

单因素多元方差分析

(1)单因素多元方差分析的MATLAB实现

MATLAB统计工具箱中提供了manoval函数,用来做单因素多元方差分析,检验多个多元正态总体是否具有相同的均值向量。调用格式如下:

<1>d=manova1(X,group)

根据样本观测值矩阵X进行单因素多元方差分析,比较X中的各组观测是否具有相同的均值向量,原假设是各组的组均值是相同的多元向量。样本观测值矩阵X是一个mxn的矩阵,它的每一列对应一个变量,每一行对应一个观测,每一个观测都是n元的。输入参数group是一个分组变量,用来标示X中的每个观测所在的组,group可以是一个分类变量、向量、字符串数组或字符串元胞数组,group的长度应该与X的行数相等,group中相同元素对应的X中的观测来自同一个总体(组)的样本。

各组的均值向量生成了一个向量空间,输出参数d是这个空间维数的估计,当d=0时,接受原假设,当d=1时在显著性水平0.05下,拒绝原假设,认为各组的组均值不全相同,但是不能拒绝他们贡献的假设;当d=2时,拒绝原假设,此时各组的组均值可能共面,但是不共线。

<2>d=manova1(X,group,alpha)

指定检验的显著性水平。返回的d是满足p>alpha的最小维数,其中p是检验的p值,此时检验各组的均值向量是否位于一个d维空间。

<3>[d,p]=manova1(......)

还返回检验的p值向量,它的第i个元素对应的原假设是:各组的均值向量位于一个i-1维空间,若p的第i个元素小于或等于给定的显著性水平,则拒绝这样的原假设。

<4>[d,p,stats]=manova1(......)

还返回一个结构体变量stats。

(2)例:

为了研究销售方式对商品的销售额的影响,选择四种商品(甲,乙,丙和丁)按三种不同的销售方式(1,2,和3)进行销售。这四种商品的销售额分别记为x1,x2,x3,x4,其数据如下表

matlab多因素方差分析解题思路,matlab正交试验方差分析

根据这些数据分析不同销售方式对销售额是否有显著影响,显著性水平为0.05.

下面调用manova1函数作单因素多元方差分析。

%从文件销售.xls中读取数据

xdata=xlsread('销售.xls');

%提取xdata的第2-5列和第8-11列,即四种商品的销售额数据

x=[xdata(:,2:5);xdata(:,8:11)];

%提取xdata的列6列和第12列,即销售方式数据

group=[xdata(:,6);xdata(:,12)];

%调用manova1函数作多元方差分析

[d,p,stats]=manova1(x,group)

d =

1

p =

0.0040

0.0917

stats =

W: [4x4 double]

B: [4x4 double]

T: [4x4 double]

dfW: 57

dfB: 2

dfT: 59

lambda: [2x1 double]

chisq: [2x1 double]

chisqdf: [2x1 double]

eigenval: [4x1 double]

eigenvec: [4x4 double]

canon: [60x4 double]

mdist: [60x1 double]

gmdist: [3x3 double]

gnames: {3x1 cell}

从manova1函数返回的结果来看,p值分别为0.004<0.05和0.0917>0.05,说明在显著性水平0.05下拒绝假设:3种销售方式所对应的销量的均值向量都相同,接受假设:3种销售方式多对应的销售量的均值向量位于一个1维空间(即共线),因此维数的估计值为d=1。总的来说,在显著性水平0.05下,可认为不同销售方式对销售额有显著影响,但是究竟对四种商品中的哪种商品的销售额影响最显著,还需要对四种商品的销售额分别做一元方差分析。

%调用anova1函数对甲商品的销售额作一元方差分析

[p1,table]=anova1(x(:,1),group)

%调用anova1函数对乙商品的销售额作一元方差分析

[p2,table2]=anova1(x(:,2),group)

%调用anova1函数对丙商品的销售额作一元方差分析

[p3,table3]=anova1(x(:,3),group)

%调用anova1函数对丁商品的销售额作一元方差分析

[p4,table4]=anova1(x(:,4),group)

p1 =

0.0411

table =

'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'

'Groups' [5.2213e+03] [ 2] [2.6106e+03] [3.3766] [0.0411]

'Error' [4.4070e+04] [57] [ 773.1500] [] []

'Total' [4.9291e+04] [59] [] [] []

p2 =

0.2078

table2 =

'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'

'Groups' [ 518.5333] [ 2] [259.2667] [1.6154] [0.2078]

'Error' [9.1481e+03] [57] [160.4921] [] []

'Total' [9.6666e+03] [59] [] [] []

p3 =

0.8478

table3 =

'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'

'Groups' [2.4808e+03] [ 2] [1.2404e+03] [0.1656] [0.8478]

'Error' [4.2703e+05] [57] [7.4917e+03] [] []

'Total' [4.2951e+05] [59] [] [] []

p4 =

8.6070e-04

table4 =

'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'

'Groups' [3.8529e+04] [ 2] [1.9265e+04] [8.0085] [8.6070e-04]

'Error' [1.3712e+05] [57] [2.4055e+03] [] []

'Total' [1.7564e+05] [59] [] [] []

对四种商品的销售额分别做了一元方差分析,得到的检验p值分别为:p1<0.05, p2>0.05,p3<0.05,p4>0.05,所以在显著性水平0.05下,可认为不同销售方式对甲商品的销售额有显著影响,对丁商品的销售额有十分显著的影响,对乙和丙商品的销售额没有显著影响。