_名师推荐 精心整理 学习必备
方差分析公式
(2012-06-26 11:03:09) 转载▼ 标签:
杂谈
分类: 统计方法
方差分析
,简写为AN0\\或ANOV)可用于两个或两个 方差分析(analysis of varianee 以上样本均数的比较。应用时要求各样本是相互独立的随机样本; 各样本来自正 态分布总体且各总体方差相等。方差分析的基本思想是按实验设计和分析目的把 全部观察值之间的总变异分为两部分或更多部分,
然后再作分析。常用的设计有
完全随机设计和随机区组设计的多个样本均数的比较。 一、完全随机设计的多个样本均数的比较
又称单因素方差分析。把总变异分解为组间(处理间)变异和组内变异(误差) 两部分。目的是推断k个样本所分别代表的卩1,卩2,……卩k是否相等,以便 比较多个处理的差别有无统计学意义。其计算公式见表
19-6.
表19-6完全随机设计的多个样本均数比较的方差分析公式
变异来源 总 离均差平方和SS 工 乂-C* 自由度v 均方MS F N-1 组间(处理组间) g'X J* J_ J J_-C b SS总-SS组间 k-1 SS组间/v组间 MS组间/MS组间 组内(误差) N-k SS组内/v组内 C=(艺X) 2/N=2 ni , k为处理组数
表19-7 F值、P值与统计结论
a 0.05 0.05 0.01 F值 P值 > 0.05 < 0.05 < 0.01 统计结论 不拒绝H,差别无统计学意义 拒绝H,接受H,差别有统计学意义 拒绝耳,接受H,差别有高度统计学意义 V F)A F)A F).05 ( v1.V2 ) .05 ( v1.V2 ) .01 ( v1.V2 ) 方差分析计算的统计量为F,按表19-7所示关系作判断
名师推荐 精心整理 学习必备
例19.9某湖水不同季节氯化物含量测量值如表 无差别?
19-8 ,问不同季节氯化物含量有
表19-8某湖水不同季节氯化物含量(mg/L) 春 22.6 22.8 21.0 X 16.9 20.0 21.9 21.5 21.2 工Xj j ni X 工 Xijj 3548.51 3231.95 2206.27 2114.11 8 20.99 8 19.91 8 16.49 8 夏 19.1 22.8 24.5 18.0 15.2 18.4 20.1 21.2 159.3 131.9 秋 18.9 13.6 17.2 15.1 16.6 14.2 16.7 19.6 129.3 冬 19.0 16.9 17.6 14.8 13.1 16.9 16.2 14.8 588.4 (工 X) 32 (N) 167.9 16.16 11100.84 (工 X) 22
HO:湖水四个季节氯化物含量的总体均数相等,即 H1:四个总体均数不等或不全相等
卩仁卩2=卩3=卩4
a =0.05
先作表19-8下半部分的基础计算。
C=(艺 x) 2/N= (588.4) 2/32=10819.205 SS 总=艺 x2-C=11100.84-10819.205=281.635 V总=N-仁31
■ 10819. 2C5= 141. ] 70
V组间=k-仁4-仁3
SS 组内=SS 总-SS 组间=281.635-141.107=140.465 V 组内=N-k=32-4=28
MS组间二SS组间 /v 组间=141.107/3=47.057
一名师推荐 精心整理 学习必备.
MS组内=SS组内 /v 组内=140.465/28=5.017 F=MSfi 间 /MS 组内=47.057/5.017=9.380
以v1 (即组间自由度)=3, v2 (即组内自由度)=28查附表19-2 , F界值表,得 F0.05 (3, 28) =2.95 , F0.01 (3, 28) =4.57.本例算得的 F=9.380>F0.01 (3, 28), Pv0.01,按a =0.05检验水准拒绝H0,接受H1,可认为湖水不同季节的 氯化物含量不等或不全相等。必要时可进一步和两两比较的q检验,以确定是否 任两总体均数间不等。
资料分析时,常把上述计算结果列入方差分析表内,如表
表19-9例19.9资料的方差分析表
变异来源 组间 组内 总
19-9.
SS 141.170 140.465 281.635 v 3 28 MS 47.057 F 9.38 P v 0.01 5.017 31 二、随机区组(配伍组)设计的多个样本均数比较
又称两因素方差分析。把总变异分解为处理间变异、区组间变异及误差三部分。 除推断k个样本所代表的总体均数,卩1,卩2,……卩k是否相等外,还要推断 b个区组所代表的总体均数是否相等。也就是说,除比较多个处理的差别有无统 计学意义外,还要比较区组间的差别有无统计学意义。该设计考虑了个体变异对 处理的影响,故可提高检验效率。
表19-10随机区组设计的多个样本均数比较的方差分析公式
变 异 来 源 总 均 离均差平方和SS 自由 方 度v MS 2 F 工X-C N-1 SSMS处 处 处 理 间 沪J b ¥冷5;一「“心小十⑷门门—八⑷十卩\" b SEIS. k-1 理/v 理 /MS 处理 误差 区 组 间 SS区 a — MS区 /v 组b-1 组MS 误差 区组
名师推荐 精心整理 学习必备
V总-V 误 SS误 差 SS总-SS处理-SS区组 处理 -V 差/V 区组 误差 C、k、N的意义同表19-6 , b为区组数
例19.10为研究酵解作用对血糖浓度的影响,从8名健康人中抽血并制成血滤液。 每个受试者的血滤液被分成4份,再随机地把4份血滤液分别放置0,45,90, 135分钟,测定其血溏浓度(表19-11),试问放置不同时间的血糖浓度有无差 别? 处理间:
H0:四个不同时间血糖浓度的总体均数相等,即
卩仁卩2=卩3=卩4
表19-11血滤放置不同时间的血糖浓度(mmol/L)
受试者小计 放置时间(分) 工Xi 0 区组号 1 2 3 4 5 6 7 8 工Xj j N X 2 45 5.27 5.22 5.83 5.38 5.44 6.22 5.72 5.11 44.19 90 4.94 4.88 5.38 5.27 5.38 5.61 5.38 5.00 41.84 135 4.61 4.66 5.00 5.00 4.88 5.22 4.88 4.44 38.69 j 20.09 20.03 22.09 21.09 21.36 23.27 21.81 19.82 169.56 (工 X) 5.27 5.27 5.88 5.44 5.66 6.22 5.83 5.27 44.84 8 5.6050 252.1996 8 5.5238 245.0671 8 5.2300 219.2962 8 32 ( N) 4.8363 187.5585 904.1214 (工 X) 2工Xij j
H1:四个总体均数不等或不全相等
a =0.05
区组间:
H0:八个区组的总体均数相等,即 卩仁卩2=……卩8 H1:八个区组的总体均数不等或不全相等
a =0.05
名师推荐 精心整理 学习必备
先作表19-11下半部分和右侧一栏的基本计算 C=(艺 X)2/N=( 169.56)2/32=898.45605 SS 总=艺 X2-C=904.1214-898.45605=5.66535 V总=N-仁32-仁31
V 处理=k-1=4-1=3
—
V区组=b-1=8-仁7
45605 = 2.493
SS误差=SS总-SS 处理-SS 区组=5.66535-2.90438-2.49800=0.26297 V误差=(k-1 )( b-1 ) =3X 7=21
MS处理=SS处理 /v 处理=2.90438/3=0.9681 MS区组=SS区组/v 区组=2.49800/7=0.3569 MS误差=SS误差 /v 误差=0.26297/21=0.0125 F 处理=MS处理 /MS 误差=0.9681/0.0125=77.448 F 区组=MS区组/MS误差=0.3569/0.0125=28.552
推断处理间的差别,按v仁3, v2=21查F界值表,得F0.005 (3, 21) =3.07 , F0.01 (3, 21) =4.87 , Pv 0.01 ;推断区组间的差别,按 v仁7, v2=21查F界值 表,得 F0.05 (7, 21) =2.49 , F0.01 ( 7, 21) =3.64 , Pv 0.01.按 a =0.05 检验 水准皆拒绝H0,接受H1,可认为放置时间长短会影响血糖浓度且不同受试者的 血糖浓度亦有差别。但尚不能认为任两个不同放置时间的血糖浓度总体均数皆有 差别,必要时可进一步作两两比较的
q检验。
表19-12例19.10资料的方差分析表
名师推荐 精心整理 学习必备
变异来源 处理间 区组间 误差 总 SS 2.90438 2.49800 0.26297 5.66538 v 3 7 21 MS 0.9681 0.3569 F 77.448 28.552 P V 0.01 V 0.01 0.0125 31 、多个样本均数间的两两比较的 q检验
经方差分析后,若按a =0.05检验水准不拒绝H0,通常就不再作进一步分析;若 按a =0.05甚至a =0.01检验水准拒绝H0, 且需了解任两个总体均数间是否都存 在差别,可进一步作多个样本均数间的两两比较。 两两比较的方法较多,在此仅 介绍较常用的q检验(Newman-Keuls法) (各组ni不等)公式(19.15)
(各组ni相等)公式(19.14)
式中,xA-xB为两两对比中,任两个对比组 A、B的样本均数之差;sxA-xB为两 样本均数差的标准误;ni为各处理组的样本含量;nA, nB分别为A B两对比组 的样本含量;MS误差为单因素方差分析中的组内均方(MS组内)或两因素方差 分析中的误差均方(MS误差)。
计算的统计量为q,按表19-13所示关系作判断。 例19.11对例19.9资料作两两比较
H0:任两个季节的湖水氯化物含量的总体均数相等,即 H1:任两总体均数不等,即 卩Ap B
表19-13 |q| 值、P值与统计结论
a 0.05 0.05
卩A=y B
|q| P值 统计结论 不拒绝差别无统计学意义 拒绝H0。接受差别有统计学意义 拒绝f,接受H,差别有高度统计学意义 V qA qA q°.05 ( v.a ) > 0.05 < 0.05 < 0.01 0.05 ( v.a ) 0.01 0.01 ( v.a )
名师推荐 精心整理 学习必备
a = 0.05
1. 将四个样本的均数由大到小排列编秩,注明处理组
Xi 处理组 秩次
167.9 春 1 159.3 夏 2 131.9 秋 3 129.3 冬 4 2. 计算sxA-xB本例各处理组的样本含量n1相等,按式(19, 14)计算两均数 差的标准误。已知 MS组内=5.017,n=8
3. 列两两比较的q检验计
算表(表19-14)
表19-14两两比较的q检验计算表 A与B X A -x B (2) (1) (1)与(4) (1)与(3) (1)与(2) (2)与(4) (2)与(3)
组数,a (3) 38.6 36.0 8.6 30.0 27.4 2.6 4 3 2 3 2 2 q值 (4) = (2) /0.7919 48.744 45.460 10.860 37.884 34.600 3.283 q0.05 ( v.a ) (5) 3.85 3.49 2.89 3.49 2.89 2.89 q0.01 ( v.a ) (6) 4.80 4.45 3.89 4.45 3.89 3.89 P值 (7) v 0.01 v 0.01 v 0.01 v 0.01 v 0.01 v 0.05 (2)与(4) 表中第(1)栏为各对比组,如第一行1与4,指A为第1组,B为第4组。第(2) 栏为两对比组均数之差,如第一行为 X1与X4之差,余类推。第(3)栏为四个 样本均数按大小排列时,A B两对比组范围内所包含的组数 a,如第一 “1与4” 范围内包含4个组,故a=4.第(4)栏是按式(19.13 )计算的统计量q值,式| 中的分母0.7919是按式(19.14 )计算出来的SXA-XB第(5)、( 6)栏是根据 误差自由度v与组数a查附表19-3q界值表所得的q界值,本例v误差=28,因 q界值表中自由度一栏无28,可用近似值30或用内插法得出q界值,本例用近 似值 30 查表,当 a=4 时,q0.05( 30,4) =3.85,q0.01 ( 30, 4) =4.80,余类 推。第(7)栏是按表19-13判定的。
4. 结论由表19-14可见,除秋季与冬季为PV0.05夕卜,其它任两对比组皆为 PV 0.01,按a =0.05检验水准均拒绝H0,接受H1,可认为不同季节的湖水氯化物 含量皆不同,春季氯化物含量最高,冬季含量最低。
名师推荐 精心整理 学习必备
PS:进行方差分析前必须要做方差齐性检验和正态分布检验
,至于如何做, 方法很多
检验。方 p值应
了,常见的正态性检验有 Kolmogorov-Smirnov 检验和 Shapiro-Wilk 差齐性常
采用Bartlett 检验。相同的数据,不同的软件,采用相同的方法给出的 该是一样的。
因篇幅问题不能全部显示,请点此查看更多更全内容