第8章假设检验例题8.1
由统计资料得知,1989 年某地新⽣⼉的平均体重为3190克,现从1990年的新⽣⼉中国机抽取100个,测得其平均体重为3210克,问1990年的新⽣⼉与1989年相⽐,体重有⽆显著差异?
★解:从调查结果看,1990 年新⽣⼉的平均体重为3210克,⽐1989年新⽣⼉的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。_种情况是,1990 年新⽣⼉的体重与1989年相⽐没有什么差别,20克的差异是由于抽样的随机性造成的;另⼀种情况是,抽样的随机性不可能造成20克这样⼤的差异,1990年新⽣⼉的体重与1989年新⽣⼉的体重相⽐确实有所增加。
上述问题的关键点是,20克的差异说明了什么?这个差异能不能⽤抽样的随机性来解释?为了回答这个问题,我们可以采取假设的⽅法。假设1989年和1990年新⽣⼉的体重没有显著差异,如果⽤µo表⽰1989年新⽣⼉的平均体重,µ表⽰1990年新⽣⼉的平均体重,我们的假设可以表⽰为µ=µ或µ⼼=0,现要利⽤1990年新⽣⼉体重的样本信息检验上述假设是否成⽴。如果成⽴,说明这两年新⽣⼉的体重没有显著差异;如果不成⽴,说明1990年新⽣⼉的体重有了明显增加。在这⾥,问题是以假设的形式提出的,问题的解决⽅案是检验提出的假设是否成⽴。所以假设检验的实质是检验我们关⼼的参数⼀1990 年的新⽣⼉总体平均体重是否等于某个我们感兴趣的数值。例8.2
某批发商欲从⼚家购进⼀批灯泡,根据合同规定灯泡的使⽤寿命平均不能低于1 000⼩时,已知灯泡燃烧寿命服从正态分布,标准差为200⼩时。在总体中随机抽取了100个灯泡,得知样本均值为960⼩时,批发商是否应该购买这批灯泡?
★解:这是⼀个单侧检验问题。显然,如果灯泡的燃烧寿命超过了1 000⼩时,批发商是欢迎的,因为他⽤已定的价格(灯泡寿命为1 000⼩时的价格)购进了更⾼质量的产品。因此,如果样本均值超过1000⼩时,他会购进这批灯泡。问题在于样本均值为960⼩时他是否应当购进。因为即便总体均值为1000⼩时,由于抽样的随机性,样本均值略⼩于1000⼩时的情况也会经常出现。在这种场合下,批发商更为关注可以容忍的下限,即当灯泡寿命低于什么⽔平时拒绝。于是检验的形式为:
例8.3
某种⼤量⽣产的袋装⾷品按规定重量不得少于250克。今从⼀批该⾷品中随机抽取50袋,发现有6袋重量低于250克,若规定不符合标准的⽐例达到5%,⾷品就不得出⼚,问该批⾷品能否出⼚?
★解:显然,不符合标准的⽐例越⼩越好。在这个产品质量检验的问题中,我们⽐较关⼼次品率的上限,即不合标准的⽐例达到多少就要拒绝。由于采⽤的是产品质量抽查,即使总体不合标准的⽐例没有超过5%,属于合格范围,但由F抽样的随机性,样本中不合标准的⽐例略⼤于5%的情况也会经常发⽣。如果采⽤右单侧检验,确定拒绝的上限临界点,那么检验的形式可以写为:
右单侧检验如图8- 6所⽰(a=0. 05).也可以把右单侧检验称为上限检验。
例8.4
某机床⼚加⼯⼀种零件,根据经验知道,该⼚加⼯零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,今另换⼀种新机床进⾏加⼯,取200个零件进⾏检验,得到椭圆度均值为0. 076mm,样本标准差为0.025mm,问新机床加⼯零件的椭圆度总体均值与以前有⽆显著差别?
★解:在这个例题中,我们所关⼼的是新机床加⼯零件的椭圆度总体均值与⽼机床加⼯零件的椭圆度均值0. 081mm是否有所不同,于是可以假设没有显著差别有显著差别
这是⼀个双侧检验问题,所以只要或⼆者之间有⼀个成⽴,就可以拒绝原假设。由题意可知,,,。因为,故选⽤z统计量。通常把称为显著性⽔平。显著性⽔平是⼀个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这既是前⾯假设检验中犯弃真错误的概率,它是⼈们根据检验的要求确定的。通常取或,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。此时不妨取,查表可以得到临界值:Z的下标表⽰双侧检验。
因为因为|z|>||,根据决策准则,拒绝可以认为新⽼机床加⼯零件椭圆度的均值有显著差别。例8.5
★解:根据前⾯的分析,采⽤左单侧检验。
在该例中已知,,,,,并假定显著性⽔平由图8- 5可知拒绝域在左侧,所以临界值为负,即,z的下标a表⽰单侧检验。进⾏检验的过程为:
由于|z|>||,即z的值位于拒绝域,所以拒绝,即这批灯泡的使⽤寿命低于1 000⼩时,批发商不应购买。
如果使⽤P值检验,按照前述⽅法,找到NORMSDIST.在z值框内录⼈样本统计量z 的绝对值2,与之相对的承数值为0.97725,由于这是单侧检验,故P值为:P=1-0.977 250=0.022 75
在单侧检验中,⽤P值直接与a⽐较,由于P(O. 022 75)
但如果在此例的假设检验中,取显著性⽔平a=0.02, 则有P>a,这时就不能拒绝
这进⼀步说明,检验的结论是建⽴在概率的基础上的。不能拒绝H并不⼀定保证H为真,只是在规定的显著性⽔平上不能拒绝原假设。上⾯的例⼦说明能在0.95的置信⽔平上拒绝原假设,却不能在0.98的置信⽔平上拒绝原假设。例8.6
其电⼦元件批量⽣产的质量标准为平均使⽤寿命1200⼩时,标准差为150⼩时。某⼚宣称它采⽤⼀种新⼯艺⽣产的元件质量⼤⼤超过规定标准。为了进⾏验证,随机抽取20件作为样本,测得平均使⽤寿命为1245⼩时。能否说该⼚的元件质量显著⾼于规定标准?
★解:⾸先需要规定检验的⽅向。在本例中某⼚称其产品质量⼤⼤超过规定标准1200⼩时,要检验这个宣称是否可信,因⽽是单侧检验。从逻辑上看,如果样本均值低于1 200 ⼩时,则元件⼚的宣称会被拒绝,即使略⾼于1 200⼩时,也会被拒绝。只有当样本均值⼤⼤超过1 200⼩时,以⾄于⽤抽样的随机性也难以解释时,才能认为该⼚产品质量确实超过规定标准。所以⽤右单侧检验更为适宜。
由题意可知,,并规定,虽然n<30,但由于已知,可以使⽤z统计量。进⾏检验的过程为:因为这是右单侧检验,由图8-6可知拒绝域在右侧,查表得到临界值。
由于Z=1.34在⾮拒绝域,所以不能拒绝,即还不能说该⼚产品质量显著⾼于规定标准。若⽤P值检验,⽅法与前⾯相同,在Z值框内输⼊1.34,得到函数值为0.9099,由于是单侧检验,故P值为:由于P>,故不能拒绝,新产品与⽼产品质量未表现出显著差别。8.7
某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂作为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性⽔平检验机器性能良好的假设。
★解:如果机器性能良好,⽣产出的肥皂厚度将在5cm上下波动,过薄或过厚都不符合产品质量标准,所以,根据题意这是双侧检验问题。
由于总体未知,且样本量n较⼩,所以应采⽤t统计量。已知条件为:,,,,。
当=0.05,⾃由度n-1=9时,查表得。因为t>,样本统计量落⼊拒绝域,故拒绝,接受,说明该机器的性能不好。8.8
⼀项统计结果声称,某市⽼年⼈⼝(年龄在65岁以上)所占的⽐例为14.7%,该市⽼年⼈⼝研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57⼈年龄在65岁以上。调查结果是否⽀持该市⽼年⼈⼝⽐例为14. 7%的看法(a=0. 05)?★解:
这是⼀个双侧检验,当时,有=
由于|z|<||,不能拒绝,可以认为调查结果⽀持了该市⽼年⼈⼝所占⽐例为14. 7%的看法。思考与联系思考题
8.1假设检验和参数估计有什么相同点和不同点?
答:参数估计和假设检验是统计推断的两个组成部分,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。参数估计讨论的是⽤样本统计量估计总体参数的⽅法,总体参数µ在估计前是未知的。⽽在参数假设检验中,则是先对µ的值提出⼀个假设,然后利⽤样本信息去检验这个假设是否成⽴。8.2什么是假设检验中的显著性⽔平?统计显著是什么意思?
答:显著性⽔平是⼀⼀个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。统计显著等价拒绝HO,指求出的值落在⼩概率的区间上,⼀般是落在0.05或⽐0.05更⼩的显著⽔平上。8.3什么是假设检验中的两类错误?
答:假设检验的结果可能是错误的,所犯的错误有两种类型,-.类错误是原假设HO为真却被我们拒绝了,犯这种错误的概率⽤a表⽰,所以也称a错误或弃真错误;另⼀类错误是原假设为伪我们却没有拒绝,犯这种错误的概论⽤β表⽰,所以也称β错误或取伪错误。
8.4两类错误之间存在什么样的数量关系?
答:在假设检验中,a与β是此消彼长的关系。如果减⼩a错误,就会增⼤犯β错误的机会,若减⼩β错误,也会增⼤犯a错误的机会。
8.5解释假设检验中的P值
答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。(它的⼤⼩取决于三个因素,⼀个是样本数据与原假设之间的差异,⼀个是样本量,再⼀个是被假设参数的总体分布。)8.6显著性⽔平与P值有何区别
答:显著性⽔平是原假设为真时,拒绝原假设的概率,是⼀个概率值,被称为抽样分布的拒绝域,⼤⼩由研究者事先确定,⼀般为0.05。⽽P只是原假设为真时所得到的样本观察结果或更极端结果出现的概率,被称为观察到的(或实测的)显著性⽔平8.7假设检验依据的基本原理是什么?
假设检验的理论依据是概率论中的⼩概率原理,该原理认为⼩概率事件在⼀次观察中是不可能出现的。换⾔之,如果在⼀次调查(即观察)中发现了⼩概率事件,就应当作出这样的判断:这种事件本⾝就不是⼀个⼩概率事件,⽽是⼀个⼤概率事件。8.8在单侧检验中原假设和备择假设的⽅向应该如何确定?解:假设问题有两种情况,⼀种是所考察的数值越⼤越好(左单侧检验或下限检验),临界值和拒绝域均在左侧;另-种是数值越⼩越
好(右单侧检验或上限检验),临界值和拒绝域均在右侧。练习题
8.1 已知某炼铁⼚的铁⽔含碳量服从正态分布N(4.55, 0.1082), 现在测定了9炉铁⽔,其平均含碳量为4.484。如果估计⽅差没有变化,能否认为现在⽣产的铁⽔平均含碳量为4.55 (a=0. 05)?
8.2 有⼀种元件,要求其使⽤寿命不得低于700⼩时。现从⼀批这种元件中随机抽取36件,测得其平均寿命为680⼩时。已知该元件寿命服从正态分布,σ=60⼩时,试在显著性⽔平0.05下确定这批元件是否合格。
8.3 某地区⼩麦的⼀般⽣产⽔平为亩产250千克,其标准差为30千克。现⽤⼀种化肥进⾏试验,从25个地块抽样,平均产量为270千克。这种化肥是否使⼩麦明显增产(a=0.05)?
8.4糖⼚⽤⾃动打包机打包,每包的标准重量是100千克。每天开⼯后需要检验⼀次打包机⼯作是否正常。某⽇开⼯后测得9包重量(单位:千克)如下:
99.3 98. 7 100.5 101.2 98.3 99.7 99.5 102.1 100. 5
已知每包的重量服从正态分布,试检验该⽇打包机⼯作是否正常(a=0. 05)。
8.5某种⼤量⽣产的袋装⾷品按规定不得少于250克。今从⼀批该⾷品中任意拍取50袋,发现有6袋低于250克。若规定不符合标准的⽐例超过5%就不得出⼚,问该批⾷品能否出⼚(a=0. 05)?
8.6 某⼚家在⼴告中声称,该⼚⽣产的汽车轮胎在正常条件下⾏驶距离超过⽬前的平均⽔平25 000公⾥。对⼀个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为27 000公⾥和5000公⾥。假定轮胎寿命服从正态分布,问该⼚家的⼴告所声称的内容是否真实(a=0. 05)?
8.7某种电⼦元件的寿命⼯服从正态分布。现测得16只⽆件的寿命(单位:⼩时)如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170
是否有理由认为元件的平均寿命显著地⼤于255⼩时(a=0.05)?
8.8随机抽取9个单位,测得结果分别为:85 59 66 81 35 57 55 63 66
以a=0.05的显著性⽔平对下述假设进⾏检验:,。
8.9 A,B两⼚⽣产同样的材料。已知其抗压强度服从正态分布,且,。从A⼚⽣产的材料中随机抽取81个样品,测得;从B⼚⽣产的材料中随机抽取64个样品,测得。根据以上调查结果,能否认为A,B两⼚⽣产的材料的平均抗压强度相同()?
8.10装配个部件可以采⽤不同的⽅法,所关⼼的问题是哪⼀个⽅法的效率更⾼劳动效率可以⽤平均装配时同来反映,现从不同的装配⽅法中各抽取12件产品,记承⼦⾃的装配时间(单位:分钟)如下:甲⽅法:31 34 29 32 35 38 34 30 29 32 31 26⼄⽅法:26 24 28 29 30 29 32 26 31 29 32 28
两总体为正态总体,且⽅差相同,间这两种⽅法的装配时间有⽆显著差别(o=0.05)?
8.11 调查了339名50岁以上的⼈,在205 名吸烟者中有43个患慢性⽓管炎,在134名不吸烟着中有13⼈患慢性⽓管炎。调查数据能否⽀持“吸烟者容易患慢性⽓管类”这种观点(a=0. 05)?
8.12为了控制贷款规模,某商业银⾏有个内部要求,平均每项贷款的效额不能超过60万元。险着经济的发展,贷款规模有增⼤的趋势。银⾏经理想了解在同样的项⽬条件下,贷款的平均规模是否明显地超过60万元,故⼀个n=144的随机样本被抽出,测得5=68.1万元,s=45。在a=0.01的显著性⽔平下采⽤P值进⾏检验。
8.13有⼀种理论认为服⽤河司匹林有助于减少⼼脏病的发⽣,为了进⾏验证,研究⼈员把⾃愿参与实验的22000⼈随机平均分成两组,⼀组⼈员每星期服⽤三次阿司匹林(样本1),另⼀组⼈员在相同的时间服⽤安慰剂(样本2)。持续3年之后进⾏检测,祥本1中有104⼈患⼼脏病,样本2中有189⼈惠⼼脏病。以a=0.05的显薯性⽔平检验服⽤阿司匹林是否可以降低⼼脏病发⽣率。
8.14某⼯⼚制造螺栓,规定课栓⼝径为7.0cn.⽅差为0.03cm。今从⼀批螺栓中拍取80个测量其⼝径,得平均值为6.97cm.⽅差为0.037 5cm,假定螺检⼝径服从正态分布,问这批螺栓是否达到规定的要求(a=0. 05)?
8.15 有⼈说在⼤学中男⽣的学习成绩⽐⼥⽣的学习成绩好。现从⼀所学校中随机挡取25名男⽣和16名⼥⽣,对他们进⾏相同题⽬的测试。测试结果表明,男⽣的平均成绩为82分,⽅差为58分,⼥⽣的平均成绩为78分,⽅差为49分。假设显著性⽔平a=0.02, 从上述数据中能得到什么结论?
因篇幅问题不能全部显示,请点此查看更多更全内容