您的当前位置:首页正文

《数据分析与统计软件》期末试题(1)

来源:客趣旅游网
A卷

20xx—20xx学年第一学期 《数据分析与统计软件》期末试卷(1)

专业班级 姓 名 学 号 开课系室 理学院应用数学系 考试日期 题 号 一 二 三 四 五 六 总分 本题满分 21 18 16 17 17 11 100 本题得分 阅卷人 注意事项:

1.本试卷正文共6页。 2.反面及附页可作草稿纸。

3.答题时请在试卷正面指定位置答题,注意书写清楚,保持卷面清洁。 4. 试卷本请勿撕开,不能铅笔答题,否则作废。

一、填空题(本题满分21分,每空3分)

1、设X为p维总体,X(i)(i1,2,L,n)是X的样本,

本题满分21分 本 题得分 1n样本均值为XX(i),则Cov(X)的常用无偏

ni1 估为:_________________________________。

2、设Y是取0,1两个值的随机变量,它受变量X1,X2的影响,则Y与变量

X1,X2的LOGISTIC回归模型为_______________________________。

422,则它的相关阵为2933、设变量(X1,X2,X3)T的协方差阵为2325________________________;偏相关系数13(2)为________________。

4、今对5人进行测试,测得2个指标:脉搏X1,引体向上次数X2,数据

如下表,则两者的样本Spearman相关系数为:__________________;两者的样本Kendall τ相关系数为:__________________ 。

X1 X2

5、在R中,对一列0,1二值观测数据向量x进行随机性检验的函数调用

格式为:____________________________。

50 15 52 12 58 13 46 17 56 14 二、(本题满分18分,分为2个小题,分别为8分和10分) 1、填写出下列经修订的R软件输出的单因子方差分析 表中所缺的数值。

ANOVA Table Source A Residuals Total Sum Sq Df 406 676 30 34 Mean Sq F 本题满分18分 本 题得分 Y01x2、设(xi,yi),i1,2,L,n是来自一元线性回归模型的样2~N(0,)¶和µ分别是和的最小二乘估计。求证:最小二乘回归方程本,而0101$¶µx经过点x,y,其中x1x,y1y。 yini01ni1i1nn

三、(本题满分16分)

设三维总体X的相关阵为:

1rrr1r(0r1)

rr1(1) 求出总体X的标准化变量的第一主成分;r多大时

才能使总体X的第一主成分的贡献率达90%以上?

(2) 将上述结果推广到p(p3)维总体情形。

本题满分16分 本 题得分 四、(本题满分17分)

收集了从事数学研究的24位数学家的年工资额Y与他们的研究成果的质量指标X1、工作年限X2、以及获得资助的指标X3的数据(data3.1.txt),利用R软件建立年工资额Y关于其他变量的多元线性回归模型,结果如下:

> x<-read.table(\"D:/data3.1.txt\> lm.reg<-lm(y~1+x1+x2+x3,data=x) > summary(lm.reg) Call:

lm(formula = y ~ 1 + x1 + x2 + x3, data = x) Residuals:

Min 1Q Median 3Q Max -3.2724 -0.8039 0.0032 1.1557 3.2311 Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 17.62493 1.99893 8.817 2.51e-08 *** x1 1.12812 0.32595 3.461 0.002468 ** x2 0.32327 0.03632 8.902 2.15e-08 *** x3 1.30343 0.29354 4.440 0.000251 *** ---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1.731 on 20 degrees of freedom

Multiple R-squared: 0.913, Adjusted R-squared: 0.9 F-statistic: 69.98 on 3 and 20 DF, p-value: 8.802e-11

本题满分17分 本 题得分 试写出:(1)残差的三均值;

(2)变量X3的系数显著性检验的p值;

(3)回归方程是否显著?为什么?如果显著,请写出回归方程; (4)如果给某位数学家的3个自变量的一组值(x01,x02,x03)为 (5.1,20,7.2),请给出该数学家的年工资额Y0的点预测值。

五、(本题满分17分)

抽取了某地52名中学生的数学(X1)、物(X2)、 化学(X3)、语文(X4)、历史(X5)和英语(X6)成 绩(data5.1.xls),利用R软件进行因子分析,结果如下:

> x<-read.csv(\"D:/data5.1.csv\

> fa<-factanal(x,2,scores=\"Bartlett\

> fa Call:

factanal(x = x, factors = 2, scores = \"Bartlett\Uniquenesses:

x1 x2 x3 x4 x5 x6 0.228 0.459 0.333 0.148 0.210 0.150 Loadings:

Factor1 Factor2 x1 -0.309 0.823 x2 -0.309 0.668 x3 0.811 x4 0.848 -0.363 x5 0.862 -0.216 x6 0.899 -0.206

Factor1 Factor2 SS loadings 2.471 2.001 Proportion Var 0.412 0.333 Cumulative Var 0.412 0.745

本题满分17分 本 题得分 试写出:(1)因子模型X*Af中的A及Cov(); (2)样本相关阵R的前两个特征根;

(3)前两个公因子的方差贡献率及累积方差贡献率;

(4)与公因子f1最相关的三个原变量,与公因子f2最相关的三个原变量。

六、(本题满分11分)

某康复俱乐部对20名中年人测量了三个生理指标:体重(X1)、腰围(X2)、脉搏(X3)和三个训练指标:引体向上(Y1)、起坐次数(Y2)、跳跃次数(Y3)数据

(data6.1.xls),利用R软件进行典型相关分析,结果如下:

> x<-read.csv(\"D:/data6.1.csv\> x<-scale(x)

> cancor(x[,1:3],x[,4:6]) $cor

[1] 0.79560815 0.20055604 0.07257029 $xcoef

[,1] [,2] [,3]

x1 -0.17788841 -0.43230348 0.04381432 x2 0.36232695 0.27085764 -0.11608883 x3 -0.01356309 -0.05301954 -0.24106633 $ycoef

[,1] [,2] [,3]

y1 -0.08018009 -0.08615561 0.29745900 y2 -0.24180670 0.02833066 -0.28373986 y3 0.16435956 0.24367781 0.09608099 $xcenter

x1 x2 x3 2.289835e-16 4.315992e-16 -1.778959e-16 $ycenter

y1 y2 y3 1.471046e-16 -1.776357e-16 4.996004e-17 试写出:(1)三个样本典型相关系数;

(2)第一对典型相关变量。

本题满分11分 本 题得分

因篇幅问题不能全部显示,请点此查看更多更全内容