您的当前位置:首页正文

统计参考答案

2020-10-01 来源:客趣旅游网
作业2――参考答案

1. 一位研究者作大学生的智商研究。他实验前先收集了如下一般资料:

a)学生的家庭收入状况:低,中,高; b)学生的考入地区:北方,中部,南方; c)学生的专业; d)学生的GPA

学生 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 S22 S23 S24 S25 家庭收入 低 中 高 低 中 高 中 中 中 中 低 低 中 中 中 高 中 中 低 低 中 高 低 中 中 考入地区 北方 中部 中部 中部 北方 南方 北方 北方 中部 中部 南方 中部 南方 北方 中部 北方 北方 南方 中部 北方 南方 中部 中部 中部 中部 专业 社会学 生理学 人类学 教育学 社会学 社会学 英语 工程 法语 化学 音乐 社会学 心理学 物理学 社会学 英语 社会学 社会学 心理学 人类学 生理学 心理学 社会学 经济学 物理学 GPA 3.11 1.88 2.64 1.12 2.53 2.96 3.16 2.32 1.96 4.00 1.27 2.42 4.00 0.76 2.70 2.10 3.83 0.09 2.65 2.17 2.73 0.13 1.58 3.68 3.25

1) 该研究的样本量是多大? 25

2) 对a)-d)的4个变量,其量度的类型是什么?它们是离散的还是连续的? a)顺序型,离散;b)命名型,离散; c)命名型,离散:d)比例型;连续;

3) 作出家庭收入状况,考入地区和专业的次数分布表

表一.大学生家庭收入状况的次数分布表

x f

高 4

中 低

14 7

1

表二、大学生考入地区的次数分布表

x 北 中 南

f 8 12 5

表三、大学生专业情况的次数分布表

x 社会学 心理学 人类学 生理学 英语 物理学 法语 化学 音乐 教育学 工程 经济学

4) 作GPA 的分组次数分布表,组距宽度为 .5, 从 .01-.50 开始

表四、GPA 的分组次数分布表

x f 3.51-4.00 4

3.01-3.50 3

2.51-3.00 6

2.01-2.50 4

1.51-2.00 3

1.01-1.50 2

f 8 3 2 2 2 2 1 1 1 1 1 1

0.51-1.00 1

0.01-0.50 2

2、研究者评价4种品牌的咖啡的味道,方法是让被试逐一品尝并对其做5点量表的评价(1——很糟糕,5——非常好)。结果如下: 咖啡 平均评价值 品牌A 2.5 品牌B 4.1 品牌C 3.2 品牌D 3.6

2

1) 指出本研究中的自变量和因变量 自变量是咖啡的品牌,

应变量是被试对咖啡味道的评价。

2) 本测量中的自变量是什么类型的数据(命名、顺序、等距、等比?) 命名类型。

3) 如果要用图来表示自变量和因变量的关系,应该用什么图(线图、直方图、

棒图)?

最合适的图形是棒图。

4) 用图表示本实验的结果。

平均评价值5432102.54.13.23.6系列1ABC咖啡品牌D

图一、咖啡品牌与被试评分关系图

3、研究者研究失眠者接受放松训练的次数对失眠治疗的效果。有4个实验组,分别接受2,4,8次的训练,控制组不接受训练(0次)。研究者测量被试入眠所需的时间,结果如下:

训练次数 入睡所需时间(分钟)

0 72 2 58 4 31 8 14

1) 判断本研究的自变量和因变量

自变量是接受放松训练的次数。 因变量是入睡所需的时间。

2) 自变量是什么数据类型(命名、顺序、等距、等比)?

自变量是等比类型的数据。

3) 如果要用图来表示自变量和因变量的关系,应该用什么图(线图、直方图、

棒图)?

最合适的图形是线图。

4) 用图表示本实验的结果。

3

80入睡时间60402000246810训练次数

图二、放松训练对失眠治疗的效果

作业3参考答案

1. 有一考试成绩分布,其平均数为71,中数79。问这是一个正态分布,还是正偏态,负偏态?

平均数容易受到极端数值的影响,而本题中平均数比中数小,所以极端数值在较小的数值部分,也就是说尾巴在左边,那么这是一个负偏态。

2. 对于下面的三种情况,请指出能最佳描述其“平均”值的集中量数(平均数、中数、众数)。

(2) 样本为50个6岁儿童,关于他们最喜欢看的电视节目的研究。 因变量是一个命名量度,所以只能选用众数作为集中量数的指标。

(3) 研究某饮食计划对病人的影响,记录6周后他们增加或减少的体重。 因变量是比例量度,而且并未表明数据中可能产生极端值,用平均数描述较好。

(4) 一项关于动机的研究,要求被试在报纸中搜索单词“disicipline”。研究者记录

被试在找到单词或放弃前所用的时间(单位,分钟)。样本n=20,平均数M=29分钟,中数17分钟,众数为15分钟。

平均数与中数和众数的差异很大,说明在分布中有极端数值,所以用中数表示集中趋势比较合适。

3. 对下面的数据

3,4,4,1,7,3,2,6,4,2,1,6,3,4,5,2,5,4,3,4

(1) 画次数分布直方图

765432101234567

(2) 指出这组数据的全距(提示:你可以使用全距公式或者只要从直方图的X轴数

一下即可。)

4

全距:7.5-0.5=7

(3)指出这组数据的四分位距和四分差。

解法一:要寻找处于25%和75%的点,先将数据从小到大排列如下: 1 1 2 2 2 3 3 3 3 4 4 4 4 4 4 5 5 6 6 7

↑ ↑ ↑ 25% (50%) 75%

由排列好的数据可见,25%tile,即Q1位于2和3之间,故Q1=2.5;同理Q3=4.5 因此,四分位距(IQR)=4.5-2.5=2,

四分差(SIQR)=1

解法二: X F P(%) CP(%) 7 1 5 100 6 2 10 95 5 2 10 85 4 6 30 75 3 4 20 45 2 3 15 25 1 2 10 10 Total 20 100 25%tile Q 1 = 2.5 75%tile Q 3 = 4.5

IQR = 4.5 - 2.5 = 2 SIQR = 1

4.一个样本 n=25,样本方差 s2= 100

(1) 求样本标准差s=sqroot(100)=10

(2) 求样本和方SS SS=(n-1) s2 =100*(25-1)=2400

5. 下列分数构成一个总体:

8, 5, 3, 7, 5, 6, 4, 7, 2, 6 5, 3, 6, 4, 5, 7, 8, 6, 5, 6

(1) 绘制次数分布直方图

总体次数分布图654f3系列121012345678x 5

(2) 在图中粗略估计分布的均值和标准差 估计的均值为(8-2+1)/2+1.5=5.0

标准差约为 (8.5-1.5)/4=1.75

(3) 计算该总体的均值和标准差, 与粗略估计的值 m= (2*1+3*2+4*2+5*5+6*5+7*3+8*2)/(1+2+2+5+5+3+2)=5.4 SS=Σx2 –(Σx) 2 / N=634-(108) 2 /20=50.8 σ2 =SS/N=2.54

σ=sqrt(2.54)=1.59

估计的均值和标准差与实际值比较接近

6‚ 计算下列样本分数 SS, 方差, 和标准差:

431, 432, 435, 432, 436, 431, 434 (1+2+5+2+6+1+4)/7=3 μ=430+3=433

SS=Σ(x-μ) 2 =4+1+4+1+9+4+1=24 s2 =SS/(n-1)=4 s=sqrt(4)=2

p.s.请大家注意是数据是样本还是总体。

总地来说,大家这次作业做得都不错,得5分的人很多,但是依然存在着几个问题:

1、 发现了抄作业现象,而且是一模一样地copy,一个字都没有改动的,这些同学要注意,

电脑提供给大家的并不是抄作业的便利;

2、 第二题中,让大家求全距和四分位差的时候很多人都同时提到了离散和连续变量两种情

况,其实这并不需要,因为直方图一般只适用于连续型变量; 3、 对于方差和标准差的计算一定要注意区分总体和样本。

作业4参考答案

1. 根据下列直观的中数示意图:

a) 按从小到大的顺序写出每一个原始分数 1,2,2,3,4,4,4,4,4,5 b) 用插值法计算中数,与图示结果比较

次数分布表

x f cf c% 5 1 10 100 4 5 9 90 x 50

6

3 1 4 40 2 2 3 30 1 1 1 10

cf: 累计次数 c%: 累计百分比

用差值法进行计算

(4.5-3.5)/(x-3.5)=(90-40)/(50-40) x=3.7

2. 指出一个正态分布中位于下列z分数区间的概率:

a) z = 0.25 —— z = 0.75

查表得p(0.25)=-0.09871 , p(0.75)=0.27337 所以p(0.25~0.75)=0.27337-0.09871=0.17466 b) z = -1.00 —— z = 1.50

查表得p(-1.00~0)=p(1.00)=0.34134 , p(1.50)=0.43319 所以p(-1.00~1.50)=0.43319+0.34134=0.77453 c) z = -0.75 —— z = 2.00

查表得p(-0.75~0)=p(0.75)=0.27337 , p(2.00)=0.47725 所以p(-0.75~2.00)=0.27337+0.47725=0.75062

3. 有一正态分布 μ= 75 , σ= 9,指出下列情况发生的概率:

a) 该分布中某一样本值小于80的概率,即X<80 b) 该分布中某一样本值小于94的概率,即X<94

c) 该分布中某一样本值大于63,且小于88的概率,即63所以,样本值小于80的概率p=0.21226+0.50000=0.71226 b)X=94对应的z分数z=(x-u)/σ=(94-75)/9=2.11

查对数分布表,其对应的p=0.48257

所以,样本值小于94的概率p=0.48257+0.50000=0.98257

c) X=63对应的z分数z=(x-u)/σ=(63-75)/9=-1.33

查对数分布表,z=1.33对应的p=0.40824

X=88对应的z分数z=(x-u)/σ=(88-75)/9=1.44 查对数分布表,其对应的p=0.42507

所以, 某一样本值大于63,且小于88的概率p=0.42507+0.40824=0.83331

d ) X=72对应的z分数z=(x-u)/σ=(72-75)/9=-0.33

X=78对应的z分数z=(x-u)/σ=(78-75)/9=0.33

查对数分布表,z=0.33对应的p=0.12930

一个分数,其值处于72-78之间的概率p=0.12930*2=0.25860

4. 有一次心理测验的成绩(成绩分布的总体为正态分布)μ= 80 ,σ= 8. 此测验中, Tom

得分 X=84, Mary得分在第 60个百分点上, John的得分换算成 z分数是 z=0.75。将此三人的分数从高到低排序。

可以将三人分数均转化为z分数或者均转化为原始分数或者均转化为百分等级然后进行比较

7

下面列出两种解决方法 方法一:转化为z分数

Tom : Z(X=84)= (84-80)/8= 0.50 Mary : Z(P=0.60)≈ 0.25 John : Z=0.75

从高到低排列John > Tom > Mary

方法二:转化为原始分数

X(John)= σ*z+μ=8*0.75+80=86 p(Mary)=0.10000 , z=0.25

X(Mary)= σ*z+μ=8*0.25+80=82 X(Tom)=84

可知,分数从高到低为John,Tom,Mary.

5. 一个正偏态的分布均值为 100 ,标准差 12. 从中随机抽取一个分数,其值大于106的

概率是多少?如果正态分布的情况,结果如何?

如果是正偏态的分布,不能够运用z分数,无法求得其概率。 如果是正态分布,z=(X-μ)/ σ=(106-100)/12=0.5

查表得p=0.19146 , 所以其值大于106的概率p=0.5-0.19146=0.30854

一个特殊制作的硬币正面向上的概率是0.8, 反面向上的概率是0.2.

a) 如果掷硬币100次,正面向上的平均期望值是多少?

平均期望值=100*0.8=80

b) 如果掷硬币100次,有95次以上正面向上的概率是多少?

Pn=0.8*100=80>10; qn= 0.2×100= 20>10,可以视为正态分布 μ= 80 ,σ= sqroot(npq)= sqroot(0.8×0.2×100)= 4 95次以上正面向上, 即X≥96, 取精确下限95.5 Z(X=95.5)= (95.5-80)/4= 3.875

P(X=95.5)= P(Z>3.875)= 0.50-0.49995= 0.00005 有95次以上正面向上的概率是0.005%

c) 如果掷硬币100次,有95次以下正面向上的概率是多少? 95的精确下限为94.5

z(94.5)=(94.5-80)/4=3.625 p(3.63)=0.49986

有95次以下正面朝上的概率=0.50000+0.49986=0.99986

d) 如果掷硬币100次,有正好95次正面向上的概率是多少? 正好95次面朝上的概率=1.00000-0.99986-0.0005=0.00009

一个是非判断测验有36道题。如果答对24题或以上算及格,单凭猜测获得及格或以上的概率是多少?

由题意:答对概率p=答错概率q=0.5

因为n*p=36*0.5=n*q=18>10 所以二次分布可近似为正态分布

μ=p*n=18 , σ=sqroot(npq)=sqroot(36*0.5*0.5)=3 z(23.5)=(23.5-18)/3=1.83 , 查表得p=0.46638

8

可知单凭猜测获得及格或以上分数的概率p=0.5-0.46638=0.03362

作业4反馈

1、关于计算过程中保留几位小数,大家好像都不太统一,这使得最后查表很成问题,有些人Z值保留三位小数,所以利用了插值法来计算对应的概率值,其实完全是不必要的;还有有些人计算到最后的概率值时,会习惯性地四舍五入,只保留3位小数。

2、在第三题的计算中,很多人都将其和二项分布的解法搞混,考虑了精确上下限问题; 3、第4题是正偏态,所以不能按正态处理,所以该题不能解答

4、有的同学没写清步骤,虽然是计算题,也不能只写结果,要把步骤写清楚,考试按步骤给分

作业6参考答案

2. 一位研究者用 Alpha = .01 的标准作了单尾的假设检验。在假设检验中,H0 被拒绝。

他的同事用同样的数据分析,但用的是 Alpha = .05 的标准作双尾的考验,结果H0 没有被拒绝。这两个统计分析有没有可能都正确?解释理由。 答:不可能都正确。

因为在0.01水平上单尾检验H0被拒绝,说明|ZOBS|≥2.33,即ZOBS≥2.33或者ZOBS≤-2.33;而如果在0.05水平上双尾检验H0没有被拒绝,说明|ZOBS|<1.65,即-1.653. 假定一位研究者通常用 Alpha = .01 的标准作假设检验,但这次他用的是 Alpha = .05

的标准。这个Alpha 水平的改变对统计效力的大小有什么影响?其对发生I 类错误的风险又有什么影响? 答:

Alpha 水平的改变会增大统计效力,不过I 类错误的风险也会相应增加。

4. 一位研究者希望提高统计效力,但同时又想避免发生I 类错误。下面所列的方法哪些

可以有助于他达到目的?解释理由。

a) 增加Alpha 水平 (如,从 .05 增加到 .10) b) 用小的Alpha 水平,同时增加样本容量 c) 使用单尾考验 答:

a)不可以达到目的。

增加Alpha 水平可以提高统计效力,但I 类错误发生的概率也增大了。

b)可以。

用小的Alpha 水平可以使I 类错误发生的概率比较小;而增加样本容量可以减小标准误从而增加统计效力。 c)可以。

单尾考验比双尾考验的效力高,而且Alpha 水平没有变化,I 类错误发生的概率也没有改变。

5. 一位研究者编制问卷来测量抑郁水平。他使用了一个非常多的“正常”个体作标准化群

体。其在这一测验上的均值和标准差为μ=55 ,σ=12。分数分布呈正态。测验中,高分表示抑郁程度高。为确定测验是否对那些有严重抑郁的个体有足够的敏感性,随机抽取了一个抑郁症病人样本,对其进行测试。得到一组数据如下:

9

59,60,60,67,65,90,89,73,74,81, 71,71,83,83,88,83,84,86,85,78,79

病人在这一测验上的分数与正常人显著不同吗?用 Alpha = .01 的标准作双尾的假设检验。 解:

(1) H0:病人在这一测验上的分数与正常人没有差异,即μ1=μ0;

H1:病人在这一测验上的分数和正常人有差异,即μ1≠μ0。 (2)考验为双尾考验。 (3)|ZCRIT(0.01)|=2.58 (4) X=76.6,

n=21;

σx=σ/sqrt(n)=2.62;

ZOBS=(76.6-55)/2.58=8.24; (5)ZOBS>|ZCRIT|,

(6)在0.01水平上拒绝H0,即病人在这一测验上与正常人有显著差异;

6. 一项运动技能任务的操作绩效呈正态分布:μ=20 ,σ=4。一位研究者用此任务来检

验是否自我意识的增加会影响操作绩效。研究者预测自我意识的增加会分散注意力,从

而降低操作绩效。随机抽取样本 n=16,让被试在大镜子前操作。得到样本均值 X=15.5. 用 Alpha = .05 的标准对研究者预测作假设检验。 解:

(1)H0:自我意识的增加不会影响操作绩效,即μ1≥μ0; H1:自我意识的增加会降低操作绩效,即μ1<μ0。 (2)考验为单尾考验,Alpha =0 .05; (3)ZCRIT(0.05)=-1.65; (4)σx=σ/sqrt(n)=1;

ZOBS=(15.5-20)/1=-4.5; (5)ZOBS(6)在0.05水平上拒绝H0,即自我意识的增加会分散注意力,从而降低操作绩效。

1. 几个不同因素会影响t 统计量的值。试描述下列因素对t 统计量的影响。在每一种情况

中,假设其它的因素都保持恒定

1) 样本分数的变异性增加 2) 样本容量增加

3) 样本均值与假设总体均值的差异增加

Xs;sxtsXns2 n1. 样本分数的变异性增加,即s增大,因此标准误增大,导致t减小。 2. 样本容量增加,标准误减小,导致t增大。

3. 样本均值与假设总体均值的差异增加,即t统计量的分子变大,所以t增

大。

请参见上面的t统计量和标准误的计算公式理解。

2. 自由度的值与t 分布的形状有什么关系?对于一个特定的Alpha 水平,当自由度的值

增加时,t 的临界值如何变化?

自由度的值越大,t分布的形状越接近正态分布;对于一个特定的Alpha 水平,当自由

10

度的值增加时,t的临界值越小。

3. 一位研究者想了解在某一领域的成功是否影响一个人的总体自尊水平。他选取了25个

有体育特长的10岁儿童。对这些儿童实测标准化的自尊量表。10岁儿童的自尊量表平均得分是µ =70。他选取的这个样本的均值是X =73, SS=2400。根据这些数据,能否得出结论体育特长儿童的总体自尊水平较高?

1. H0: 表示体育特长儿童的总体自尊水平与普通儿童无显著差异

H1: 表示体育特长儿童的总体自尊水平较高。

2. 确定显著性标准为Alpha = 0.05; 这是一个单尾考验 3. df=25-1=24 查表得tcrit=1.711

4. 计算实际t分数:s= sqrt(SS/n-1)=sqrt(2400/25-1)=10

sXbar=s/sqrt(n)=10/5=2 tobs=( Xbar-μ)/ sXbar=1.5

5. 比较得:tobs< tcrit

6. 对H0做结论:不能拒绝虚无假设(Alpha = 0.05),即体育特长儿童的总体自尊水平没

有显著高于10岁儿童的平均水平。

5. 家庭治疗家根据大量调查得到十几岁少年的父母每星期与他们交谈的平均时间是27分

钟。一位研究者对此结论感到出乎意料,亲自进行了一番调查。他搜集到n=12的样本,发现父母每星期与少年交谈的平均时间如下:

29,22,19,25,27,28,21,22,24,26,30,22

这位研究者的发现与家庭治疗家的结论有显著差异吗?如果有差异,家庭治疗家是低估还是高估了父母与少年的交谈时间?

1. H0:µ1==µ0,表示研究者的发现与家庭治疗家的结论没有显著差异

H1:µ1≠µ0,表示研究者的发现与家庭治疗家的结论有显著差异 确定显著性标准为Alpha = .05(双侧界限)

2. 这是一个双尾检验,df=12-1=11 查表得tcrit=2.201

4. 计算实际t分数:Xbar=24.58 SS=∑x2 -(∑x)2/N =132.92 s= sqrt(SS/n-1)=sqrt(132.92/12-1)=3.476

sXbar= s / sqrt(n)=1.003 tobs=( Xbar-μ)/ sXbar=-2.41

5. 比较得:-tcrit> tobs

6. 对H0做结论:拒绝H0,研究者的发现与家庭治疗家的结论有显著差异,家庭治疗家高估了父母与少年的交谈时间。

作业7参考答案

1. 一位研究者对长子与次子的心理特征感兴趣。他在一年级大学生中随机抽取了10个长

子和20个非长子对其施测自尊量表。10个长子在量表上的平均分是X = 48, SS=670。 20个非长子的平均分是X = 41, SS=1010。这些数据表明两组间是否有显著差异?用α= .01 的显著性水平作假设检验。 解:

1) HO:长子与次子的自尊成绩没有显著差异,即:μ1=μ2;

H1:长子与次子的自尊成绩有显著差异,即:μ1≠μ2; 2) 依题意,用双尾检验,α=0.01; 3) df=10+20-2=28,|tcrit|=2.763;

11

4) X1=48,S1=SS1/9=74.4;X2=41,S2=SS2/19=53.2;

22

5) Fmax=s1/s2=74.4/53.2=1.40<2,根据拇指原则,可以认为两个总体方差同质;

2

6) Sp=(ss1+ss2)/(df1+df2)=(670+1010)/28=60;

22

Sx1-x2=sqrt(sp/n1+sp/n2)=3; tobs=(48-41)/3=2.33;

7) tobs<|tcrit|,在0.01水平上不能拒绝H0,

所以,可以认为长子与次子在自尊上没有显著差异。

2. 在认知失调理论的经典实验中,Festinger (1959)和他的同事让40名大学生被试参加

一个非常枯燥乏味的实验。完成实验后指示这些被试对其他人说这是一个有趣的实验,劝其参加。将这些被试随机分成两组。其中一组的20人每人给1美元的报酬(低报酬组),另一组每人给20美元的报酬(高报酬组)。之后,让每个学生评定实验的有趣程度(高分表示认为实验比较有趣)。下面是一组虚构的数据: 低报酬组 3 5 8 2 6

认知失调理论预测低报酬组比高报酬组更容易以为实验真的有趣。因为这样比较容易让他们认知协调。那些得到足够报酬的被试则不需要改变态度,因此其观点更容易反映真实的情况。以上数据有没有支持这个预测?(用α= .01 的显著性水平) 解:

1) H0:低报酬组没有比高报酬组更容易以为实验真的有趣,即:μ1≤μ2;

H1:低报酬组的确比高报酬组更容易以为实验真的有趣,即:μ1>μ2; 2) 依题意,使用单尾考验,α=0.01;

22

3) Fmax=s1/s2=1.28<2,根据拇指原则,可以认为两个总体方差同质; 4) df=38; tcrit=2.457; 5) X1=5.1;X2=2.95;

SS1=49.8;SS2=38.95; 2

Sp=( SS1+ SS2)/(df1+df2)=(49.8+38.95)/38=2.34;

22

Sx1-x2=sqrt(sp/n1+sp/n2)=0.48; tobs=(5.1-2.95)/0.48=4.48;

6) tobs>tcrit;所以在0.01水平上拒绝H0;

数据支持题目提到的预测,即低报酬组的确比高报酬组更容易以为实验真的有趣。

3. 以下数据给出了两个职业组的样本在Catttel (1973)16因素人格量表中的轻松-紧张维

度上的得分 (分数越低,表明越轻松)。 作家 飞行员

以上数据显示这两个职业组在轻松-紧张维度上的得分有显著差异吗? (用α= .05 的显著性水平)

12

22

高报酬组 6 7 8 4 5

1 3 2 1 5

2 5 3 2 1

5 4 4 3 1

2 5 4 3 3

3 5 5 6 7 4 5 4 4 5

7 4 7 2 6 2 9 3 8 1 8 5 7 4 9 3 5 2 3 2 6 6 8 2 7 5 9 3 1) H0:两个职业组在轻松-紧张维度上的得分没有显著差异,即:μ1=μ2;

H1:两个职业组在轻松-紧张维度上的得分有显著差异,即:μ1≠μ2; (μ1为作家平均值;μ2为飞行员的平均值) 2) 双尾考验,α=0.05;

22

3) Fmax=s1/s2=1.33<2,根据拇指原则,可以认为两个总体方差同质; 4)df=26, |tcrit|=2.056; 5)X1=7.07;X2=3.14;

SS1=36.93;SS2=27.71;

2

加权和方Sp=( SS1+ SS2)/(df1+df2)=(34.9+27.7)/26=2.49;

22

Sx1-x2=sqrt(Sp/n1+Sp/n2)=0.60; tobs=(7.07-3.14)/0.60=6.55;

6) tobs>tcrit;所以在0.05水平上拒绝H0,即两种职业的人在轻松-紧张维度上有显著差异。

1. 以下是比较两种处理条件下作业成绩的数据: 处理1 处理2 差距 10 11 1 2 5 3 1 2 1 15 18 3 7 9 2 X = 7 X = 9 X = 2 SS=134 SS=150 SS=4

a) 假设以上数据来自独立指标设计的实验,用 t 检验来确定两种处理条件

下作业成绩有无显著差异 (用Alpha = .05) 独立样本检验 H0: µ1=µ2 H1: µ1≠µ2

双尾检验,  =.05,df= 10 - 2= 8, tcrit= +2.306 S1²=S S1/df1=33.5 S2²=S S2/df2=37.5 F-max= S2²/ S1²=1.12<4 两个总体方差同质 Sp²=( S S1+ S S2)/df=(134+150)/8=35.5

Sx1-x2=sqrt(Sp²/n1+ Sp²/n2)=sqrt(35.5/5+35.5/5)=3.77 tobs = [(X1-X2)-( μ1-μ2)]/ Sx1-x2=[(9-7)-0]/3=0.53 tobs不能拒绝H0,两种处理下作业成绩无差异,t=0.53, p>0.05

b) 假设以上数据来自重复指标设计的实验,用 t 检验来确定两种处理条件

下作业成绩有无显著差异 (用Alpha = .05) 相关样本检验 H0: µ1=µ2

13

H1: µ1≠µ2

α=0.05, 双尾考验, df=5-1=4, tcrit=+2.776 ΣD=10 , ΣD²=24

S²=[ΣD²-(ΣD)²/n]/df=(24-100/5)/4=1 SD=sqrt(S²/n)=sqrt(1/5)=0.447 tobs= Dbar-0/ SD = (9-7) /0.447=4.474 tobs > tcrit

拒绝H0,两种处理条件下作业成绩有显著差异, t=4.474, p<0.05 c) 如何解释a)b)二者的不同结论

a)是独立样本,b)为相关样本,在相关样本t检验中,去除了个体差异的因素,使得误差方差减小,所以在检验平均数差异的时候效力提高。

2. 为了确定日常的体育锻炼多大的运动量适宜,一位研究者用了7组被试,将

其年龄,性别,体重,健康状况等有关变量加以匹配。其中一组被试每星期锻炼2小时,另一组被试每星期锻炼5小时,一段时间后让医生评定其健康状况,得到以下数据。这些数据是否说明运动量对健康有影响?

被试对 锻炼2小时组 锻炼5小时组 D D2

A 15 18 3 9 B 12 14 2 4 C 16 12 -4 16 D 9 11 2 4 E 13 14 1 1 F 16 16 0 0 G 17 16 -1 1 3 35

相关样本检验 H0: µ1=µ2 H1: µ1≠µ2

双尾检验,α=.05,df= n-1= 6, tcrit= +2.447 ΣD=3, ΣD²=35

S²=[ΣD²-(ΣD)²/n]/df=(35-9/7)/6=5.619 SD =sqrt(S²/n)=sqrt(5.619/7)=0.896

tobs= Dbar-0/ SD = (14.429-14) /0.896=0.479 tobs不能拒绝H0,即运动量对健康没有显著影响,t=0.479, p>0.05

14

3. 下表是感觉剥夺1小时前后测得7名被试的听阈。感觉剥夺实验是否对被试

的听阈有显著影响?

被试 前测 后测 D D2

1 1 A 31 30

3 9 B 34 31

0 0 C 29 29

4 16 D 33 29

3 9 E 35 32

-2 4 F 32 34

7 49 G 35 28

16 88

相关样本t检验 H0: µ1=µ2 H1: µ1≠µ2

双尾t检验, α=.05, df= n-1= 6, tcrit= +2.447 ΣD=16, ΣD²=88

SSD=ΣD2 -(ΣD)2/N = 88- 162/7= 88-36.571= 51.429

SD 2= SSD /df= 51.429/6= 8.5715, SDbar = sqroot(SD 2/n)= sqroot(8.5715/7)= 1.107

tobs= Dbar-0/ SD = 2.29/1.107=2.069 tobs不能拒绝H0, 感觉剥夺对被试的听阈没有显著影响, t=2.069, p<0.05

注:符号比较难输入,请大家以笔记上的符号为标准。

作业8反馈

1. 部分同学还没有注意在运算中保持3位,最后结果保持2位的准则

2. 当样本容量增加时会导致标准误减少,从而置信区间宽度减小,好像有几个同学搞错了 总的来讲,同学们都做得不错。

1、对量度还没有很好地理解,很多同学在回答量度时,往往混淆概念,第一题对于GPA到底是什么等级量表的回答,很多人都写是“等距量表”,正确答案应该是等比量表,大家好像还搞不清这两个量表间的区别,此外对“接受放松训练的次数”的量度回答也出现类似问题。

2、对线图的运用有的同学还缺乏更好的理解,最后一题有同学选用直方图,但要表示变化趋势,最佳的还是线图

15

3、还有就是分组中常出现的几个问题: 如:分组组距过大,这个我一般都没扣分;

有些人写了组中值,但是组中值也没有写正确,这个我也没扣分; 分组的时候对于精确上下限还是难以把握,常见的错误有:

各组的上下限有重叠,如:第一组0.1——0.5,第二组0.5——1.0;

对于4.00的错误归属,如:前面几组是0——0.49、 0.5——0.99等,以此类推,最后

一组应该是3.55——3.99,但是很多人却把4.00归入这一组,直接写成3.55——4.00,不知是出于一时笔误还是概念把握不清楚,总之大家都要注意这些小细节! 作业反馈:

总体来说大家的作业都做得不错,但是有一些小问题

1、 对于假设检验的格式不够认真,有的人甚至连H0、H1都没写就直接算题,假设检验一

些最基本的成份还是应该具备的;

2、 Z的临界值一般不需要用插值法计算,一般有公认值,比如1.65、2.58。

3、 第三题双尾考验不增加犯一类错误的概率,但是会增加统计效力,但是前提是要很清楚

研究效应的作用方向。

4、 还有一些小问题,就是在查临界值时,有些人用.01,有些人用.05,标准不统一。

16

因篇幅问题不能全部显示,请点此查看更多更全内容