您的当前位置:首页正文

SAS与统计分析实验报告

2021-09-03 来源:客趣旅游网
一、实习目的:

1、 了解SAS系统的基本知识及操作方法。 2、 学会运用SAS系统进行数据的处理与分析。 二、实习工具:

SAS软件 三、实习内容:

1、 T测验

① 单组样本均数的T测验

例:已知某小麦品种的平均株高为65cm,施肥后,随机抽取10株小麦进行测量,得到10株小麦株高分别为64 cm、66 cm、63 cm、68 cm、70 cm、65 cm、67 cm、68 cm、66 cm、69 cm.试验施肥后平均株高与已知的平均株高65 cm间的差异显著性。 ●假如株高变量名为G, SAS程序如下: data whq1; input G@@; cards;

64 66 63 68 70 65 67 68 66 69 ; run;

proc ttest data=whq1 ci=none h0=65 alpha=0.05; var G; run;

● 程序说明:

过程选项h0=65 指定零假设 ho:u=65,检验抽样总体的均值是否为65,alpha=0.05用来指定结果中各统计量可信区间的置信水平。语句var G指定要检验的变量。 ● 程序运行结果:

The TTEST Procedure Statistics Lower CL Upper CL

Variable N Mean Mean Mean Std Dev Std Err Minimum Maximum G 10 65.011 66.6 68.189 2.2211 0.7024 63 70 T-Tests

Variable DF t Value Pr > |t| G 9 2.28 0.0487 ●结果说明:

结果中首先给出了输入数据集中分析变量的有关统计量,其中包括均数及其可信区间、标准差及其可信区间。然后给出均数的标准误、观测值最大值和最小值。最后,给出单组样本均数比较的T检验结果。本例中t=2.28,对应的P值为0.0487。根据分析结果可作出结论:施肥后平均株高与已知的平均株高65 cm有显著差异。

② 配对数据均数的T测验

例:A、B两个玉米品种在6个地点进行产量比较试验,产量(kg/小区)如下:

地点 A品种 B品种 1 86 80 2 87 79 3 56 58 4 93 91 5 84 77 6 93 82 试检验A、B两个品种产量是否存在显著差异。

●SAS程序为:

input a b@@; cards;

86 87 56 93 84 9380 79 58 91 77 82 ;

procttestdata=gyf2 ci=none H0=0; paired a*b; run;

●程序说明:

过程选项h0=0 指定零假设ho:Ua-Ub=0,检验A、B两地玉米产量差均值是否为0。语句paired a*b指定要取差值的两个变量。 ●程序运行结果:

The TTEST Procedure

Statistics

Lower CL Upper CL

Difference N Mean MeanMeanStdDevStd Err Minimum Maximum

a - b 6 -31.5 -14 3.4976 16.673 6.8069 -37 1 T-Tests Difference DF t Value Pr> |t| a - b 5 -2.06 0.0948

●结果说明:

结果中首先给出了输入数据集中分析变量的有关统计量,其中包括均数及其可信区间、标准差及其可信区间。然后给出均数的标准误、观测值最大值和最小值。最后,给出配对数据均数比较的T检验结果。本例中t=-2.06,对应的P值为0.0948。根据分析结果可作出结论:A、B两个玉米品种产量存在显著差异。 2.方差分析:

①.单因素完全随机设计

对5个硼肥试验处理中,测得苹果叶内硼的含量(mg/kg),得如下数据: 处理 1 2 3 4 5 8 41 17 28 40 7 44 15 33 43 叶内含硼量 6 46 14 36 42 9 40 12 29 39 10 38 22 21 44 12 36 15 22 41 试比较个处理苹果叶内平均含硼量差异的显著性,并在0.01显著性下进行多重比较。 ● 以v 和y分别表示处理和含硼量,SAS程序为:

data gyf3; input v y@@; cards;

1 8 2 41 3 17 4 28 5 40 1 7 2 44 3 16 4 33 5 43 1 5 2 46 3 14 4 36 5 42 1 9 2 40 3 12 4 29 5 39 1 10 2 38 3 22 4 21 5 44

1 12 2 36 3 15 4 22 5 41 ;

procanovadata=gyf3; class v; model y=v;

means v/lsdalpha=0.01; run;

● 程序说明:

语句class v指定分组变量为v,model语句中的表达式为 y=v。means语句指定对变量v进行各水平之间平均数的LSD多重比较,显著水平为0.01。 ● 程序运行结果:

The ANOVA Procedure

Class Level Information Class Levels Values variety 5 1 2 3 4 5

Number of observations 30

The ANOVA Procedure Dependent Variable: y

Source DF Sum of Squares Mean Square F Value Pr> F Model 4 5197.333333 1299.333333 93.16 <.0001 Error 25 348.666667 13.946667 Corrected Total 29 5546.000000

R-Square CoeffVar Root MSE y Mean 0.937132 13.83157 3.734524 27.00000

Source DF Anova SS Mean Square F Value Pr> F

variety 4 5197.333333 1299.333333 93.16 <.0001

The ANOVA Procedure

t Tests (LSD) for y

NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise errorrate. Alpha 0.01

Error Degrees of Freedom 25 Error Mean Square 13.94667 Critical Value of t 2.78744 Least Significant Difference 6.0101 Means with the same letter are not significantly different. t Grouping Mean N v

A 41.500 6 5 A

A 40.833 6 2 B 28.167 6 4 C 16.000 6 3

D 8.500 6 1

● 结果说明:

结果中先给出模型及处理效应方差分析有关的统计量。本例方差分析表明处理间差异显

著(F值为93.16,P值小于0.0001)。然后给出多重比较的参数设置以及所用的统计情况,包括误差自由度、误差均方,临界t值和效应差值。最后对variety进行多重比较。根据分析结果可作出结论:不同处理之间存在显著差异,处理1、2间不存在显著差异,2与3间存在显著差异,3与4间存在显著差异,4与5间存在显著差异。

2、 回归分析:

例:某水稻品种5月5日至8月5日播种(每隔10天播一期),测定播种至齐穗的天数x和播种至齐穗的总积温y的数据,如下所示: X Y 1 70 1616.3 2 67 1610.9 3 55 1440.0 4 52 1440.7 5 51 1423.3 6 52 1471.3 7 51 1421.8 8 60 1547.1 9 64 1533.0 试进行回归分析。 ● SAS程序如下: data whq4; input x y@@; cards;

70 1616.3 67 1610.9 55 1440.0 52 1440.7 51 1423.3 52 1471.3 51 1421.8 60 1547.1 64 1533.0 ; run;

proc reg data=whq4 corr simple; model y=x; run;

● 程序说明:reg专门用于回归分析,model语句的表达式为y=x. ● 程序运行结果:

The REG Procedure Model: MODEL1 Dependent Variable: y Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F Model 1 45167 45167 81.05 <.0001 Error 7 3900.78231 557.25462 Corrected Total 8 49068

Root MSE 23.60624 R-Square 0.9205

Dependent Mean 1500.48889 Adj R-Sq 0.9091 Coeff Var 1.57324

Parameter Estimates Parameter Standard

Variable DF Estimate Error t Value Pr > |t| Intercept 1 915.49880 65.45227 13.99 <.0001 x 1 10.08604 1.12030 9.00 <.0001 ● 结果说明:

分析结果中首先给出有关模型的一般信息和模型的方差分析结果。方差分析表明,回归模型的显著性检验概率<0.0001,说明模型极显著。然后给出有关模型拟合的重要统计量,包括误差均方平方根、决定系数、应变量的均数等。决定系数为0.9205,说明模型有较高的拟合精度。根据运行结果作出结论:播种至齐穗的总积温显著地决定于播种至齐穗的天数。

回归方程:y= 915.49880+ 10.08604x

四、实习总结:

SAS课程已经结束,在老师的耐心教导和上机操作实习,我学习到了很多。SAS(Statistical Analysis System)是世界上最著名的统计分析系统之一,具有完备的数据访问、管理、分析和呈现功能,被誉为国际标准统计分析系统。SAS软件在我们生活中起到了很多的作用:1.可以进行数据管理。2.可以数据输入、建库、保存。。。3.进行统计分析。4.t检验。5.方差分析。6.卡方检验。7.相关、回归。8.秩和检验。

在学习过程中,一开始学习比较困难和吃力,很多知识都是刚刚接触,比较陌生,学习起来比较吃力,但随着老师的讲解和基础知识的逐步掌握,开始对SAS的应用开始比较灵活。希望在以后还要继续学习和运用,将课堂中学到的知识很好的运用到实践当中去。

·

SAS与统计分析实验报告

学院 班级 姓名 学号

因篇幅问题不能全部显示,请点此查看更多更全内容