学号 20110813121 姓名 卢丽丽 学院 资环学院 专业 安全技术及工程 成绩
实验数据处理中一元线性回归的应用
摘要:
我们处理实验数据时数理统计方法往往能帮助我们很好的处理,并且能得到很好的结果,回归分析主要是从大量反映某些变量间关系的观测值出发,分析变量问相关程度及相关关系,并建立回归模型去拟合变量间的关系,从而达到对变量之间关系的认识的方法。其中一元线性回归模型在很多实验中能很好的帮我们预测未来数据和预测数据范围。本文运用一元线性回归模型对试验中电流与时间的关系进行了分析,发现,试验中电流随时间逐渐减小,并呈线性递减关系。通过求得的模型,我们进行了预测。
一、问题提出,问题分析
在现代社会,随着科技的发展,人们生活水平提高,可是污染也越来愈严重,特别是重金属的污染,同时治理污染的方法也在改善。重金属污染修复技术也得到发展,我们在做重金属的电动修复实验过程中,对其修复区的电流进行了观测,有观测值我们作出散点图,发现电流与时间有明显线性关系,我们用一元线性回归的方法分析这组数据,并预测未来电流的变化,以更好的掌握实验条件,为实验数据提供合理的解释。 二、数据描述
下面是随着时间电流的变化数据,表中时间是指通电时间。
表1 电流随时间变化表
时间(小时) 电流(毫安) 6 105.8 18 83.7 30 69.8 42 64.8 54 54.5 66 40.4 78 21.8 90 23.6 102 13.6 114 13.9 根据数据,我们利用Excel作出散点图,如图1
电流随时间变化图120100105.883.769.864.854.540.421.823.60204060时间(h)8010016.613.9120电流(mA)电流(mA)806040200
图1 电流随时间变化的散点图
第1页 共5页
2010-2011年第一学期研究生“应用数理统计”课程课外作业
由图中点的趋势我们可以看出,电流随时间基本呈线性关系,我们求出其相关系数如下表:
表2 电流与时间相关系数表
相关系数R 时间x 电流y 时间x 1 -0.97602 电流y 1 由表2可知,R=-0.97602,说明电流与时间有明显线性关系。 三、模型建立
(1)提出假设条件,明确概念,引进参数
根据上面分析,我们知道,电流随时间基本呈线性关系,我们假设电流与时间是线性的,我们用一元线性回归模型进行拟合,并用F检验法和t检验法进行模型检验,各函数符号代表含义如下:
x:电流; y:实验时间
xi:各点电流值 yi:各点实验时间
:显著性水平,设=0.05 (2)模型构建
我们假定这组数据满足一元线性回归模型: y01x一元线性模型: 2~N(0,)(3)模型求解
先用最小二乘估计方法求出模型如下: 计算基本数据,如下表:
表3 基本数据表
数据组 1 2 3 4 5 6 7 8 9 10 ∑ 时间xi 6 18 30 42 54 66 78 90 102 114 600 电流yi 105.8 83.7 69.8 64.8 54.5 40.4 21.8 23.6 16.6 13.9 494.9 xi2 36 324 900 1764 2916 4356 6084 8100 10404 12996 47880 yi2 11193.64 7005.69 4872.04 4199.04 2970.25 1632.16 475.24 556.96 275.56 193.21 33373.79 xiyi 634.8 1506.6 2094 2721.6 2943 2666.4 1700.4 2124 1693.2 1584.6 19668.6 由表得: 第2页 共5页
2010-2011年第一学期研究生“应用数理统计”课程课外作业
x600494.960y49.49 101010lxyxiyi10xy19668.6106049.4910025.4
i110lxxxi210x2478801060211880
i110lyyyi210y233373.791049.4928881.189
i1ˆ1lxylxx10025.40.8439
11880ˆyˆx100.124 01222ˆ2l420.6425 SESTSRlyy1xx2SE420.6425ˆ7.2512
n28ˆˆx100.1240.8439x ˆ回归直线为:y01该方程说明,在刚开始实验时,加的电流为100.124mA。在一定实验条件和范围内,
每过1小时,电流就减少0.8439mA。 ①用F检验法检验:
cˆ2F1(1,n2)lxxˆ2F0.95(1,8)lxx7.251225.320.0235
11880拒绝域为:120.0235,
ˆ2(0.8439)20.7120.0235,落在拒绝中,即电流变化受时间影响,即:电而1流与时间呈线性关系。 ②用t检验法检验:
cˆlxxt1(n2)27.2512t0.975(8)1.36442.3060.1534 11880ˆ0.1534 拒绝域为:1ˆ0.8439,显然落在拒绝域中,即电流与时间有线性关系 1四、计算方法设计和计算机实现
我们用Excle来实现其模型拟合并进行检验,其结果如下面表中数据:
第3页 共5页
2010-2011年第一学期研究生“应用数理统计”课程课外作业
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 0.976018 0.952612 0.946688 7.253149 10
回归分析 残差 总计 Intercept 时间x df 1 8 9 SS 8460.324 420.8653 8881.189 MS 8460.324 52.60817 F 160.8177 Significance F 1.41E-06 Coefficients 标准误差 t St at 100.1233 -0.84389 P-value Lower 95% Upper 95% 下限 95.0% 上限 95.0% 110.7416 -0.69043 89.50502 -0.99734 110.7416 -0.69043 4.604637 21.74402 2.11E-08 89.50502 0.066545 -12.6814 1.41E-06 -0.99734
观测值 1 2 3 4 5 6 7 8 9 10 预测 电流y 95.06 84.93333 74.80667 64.68 54.55333 44.42667 34.3 24.17333 14.04667 3.92 残差 10.74 -1.23333 -5.00667 0.12 -0.05333 -4.02667 -12.5 -0.57333 2.553333 9.98 标准残差 1.570558 -0.18036 -0.73215 0.017548 -0.0078 -0.58884 -1.82793 -0.08384 0.373385 1.45942 时间x Line Fit Plot150100500050时间x
图2 估测值与预测值关系图
电流y电流y预测 电流y100150五、主要的结论或发现
我们分别用最小二乘法和EXCEL对数据进行了回归分析,得出的回归方程基本一致,
第4页 共5页
2010-2011年第一学期研究生“应用数理统计”课程课外作业
ˆˆx100.1240.8439x ˆ即电流与时间的关系模型为:y01利用该模型可预测未来几天内的电流数据。
六、结果分析与检验
分析结果,可得下述检验结论:
拟合程度检验:在回归统计区域中给出的R2 为0. 952612 ,调整后的R2 为0. 946688 ,较接近1 ,说明x 与y 的直线关系成立。 F 检验:
在方差分析区域中给出的F 检验值为160.8177。
F0.05(1,8) = 0.0041,F 检验值远远大于F0.05(1,8),说明x 与y 的回归方程显著。
t 检验:
ˆ 的估计值极其标准误差、t 检验值和回ˆ 、在回归模型区域中给出了回归系数10ˆ = -0.84389 ˆ= 100.1233、归系数估计区间的上下限等。10ˆ 的t 检验值为-12.6814 ,t(8)=- 2.306 回归系数10.052t 检验值大于t0.05(8)故拒绝原假设,即可以断言,时间对电流有显著影响。
2综合上述计算结果和检验结果,确定回归模型如下:
ˆˆx100.12330.84389x ˆy01参考资料
1 杨虎,刘琼荪等.数理统计.北京:高等教育出版社,2004
2 赵丽娟,冯韶华. Excel 在一元线性回归预测分析中的应用.Journal of Handan Polytechnic College,2006,19(4). 3 中斯,董新华.一元线性回归分析中Excel的应用.信阳农业高等专科学校学报.2006,V01.16 No.2.
附录
模型求解Excel命令:
1 选择工具菜单中的数据分析命令,弹出数据分析对话框。 2 在分析工具列表框中选择回归工具,弹出回归对话框。
3 指定输入参数。在输入Y区域、输入X 区域指定相应数据所在的单元格区域,本例分别指定为A1:A11 和B1:B11,并选定标志复选框,在置信水平框内键入95%。对于一些特殊的回归模型,可以根据需要指定常数为0。 4 指定输出选项。这里选择输出到新工作表组,并指定工作表的名称为“回归模型”。选定残差(即随机误差项) 、线性拟合图和正态分布中的所有输出选项,以观察相应的结果。
第5页 共5页
因篇幅问题不能全部显示,请点此查看更多更全内容