您的当前位置:首页正文

预测模型

2022-11-29 来源:客趣旅游网
预测模型

 预测模型概述  如何建立回归模型  特殊的回归模型  软件—EViews

一、预测模型概述

模型功能:根据已知信息推测未知信息 模型原理: 预测期 样本期 1.假设未来与过去的变化趋势相同,所以可以用已知趋势推测未来——趋势预测。

模型:时间序列模型、灰色预测系统、马尔科夫过程等。

2.假设预测期内变量之间的相互关系与样本期相同,所以可以

用已知关系推测未来——因果预测。

模型:回归模型、马尔科夫模型、灰色系统模型等。

模型要求:

趋势预测模型——准确描述预测变量的变化趋势

回归预测模型——准确描述预测变量与影响因素之间的关系

yf(x1,x2,...,xk)

线性关系:yab1x1b2x2bkxk

(1) 模型的函数形式正确;

(2) 模型包含了影响y变化的(所有)主要因素;

——模型的预测能力

(3) 模型中的每个因素对y都有重要影响。

二、如何建立回归模型

1.函数形式的确定 步骤:

(1) 绘制散点图(XY相关图),观察相关类型;—— SCAT命令 (2) 选择不同模型拟合数据; —— LS命令 (3) 比较不同模型的整体拟合情况; —— 判定系数R2 (4) 比较不同模型的近期拟合情况; —— 残差图

可供选择的模型:

线性模型: yab1x1b2x2bkxk 双对数模型:lnyablnx 对数模型: yablnx 指数模型: lnyabx 二次函数: yab1xb2x2

双曲函数模型: yab,abx,ab

1xyAxb-幂函数

1y1y1x【例题1】我国税收预测模型(EX1)

y——税收 (1)绘制相关图: SCAT X Y

x——国内生产总值 样本期:1985-1998 (2)建立模型: 线性: LS Y C X

预测按钮 残差按钮 判定系数 调整判定系数

残差按钮

(3)比较不同模型的整体拟合情况 模型 线性 对数 命令 LS Y C X LS Y C log(X) LS log(Y) C X LS log(Y) C log(X) LS Y C X X^2 R2 /A.R2 0.98268 0.88689 0.98412 0.98279 指数 双对数 0.97363 0.99176 0.99026 二次函数 (4)比较不同模型的近期拟合情况

二次函数 点击View按钮

指数函数

所以,最终预测模型为:

lny7.50862.07*105x R2=0.9841 F=743.57

或将模型还原成:

y=1823.66x0.0000207

预测:键入命令: (1)点击FORCAST按钮(2)选择变量名为YF (3)PLOT Y YF

SE=0.0693

2.多元回归模型中变量影响的显著性分析 【例题2】我国工业生产函数模型(EX2)

Yf(L,K,t,)

模型1:Y67577.6789t0.6667L0.7764KR20.9958 模型2:lnY0.01140.0140t0.4665lnL0.5605lnKR20.9959√

问题:模型中所有变量对Y是否都有显著影响?

变量的显著性检验:

lnYab1tb2lnLb3lnK

H0:bi = 0

tH1:bi ≠ 0 i = 1,2,3

检验统计量: 当

bi~t(nk1) S(bi)|t|t/2时,拒绝H0,即认为xi对Y的影响显著;否则,则

认为xi对Y无影响显著,应该从模型中剔除而重新建立模型。

实际应用中,是根据t统计量的伴随概率p是否<0.05(或0.01)

进行判断:若p<0.05,则有|t|t0.025,xi对Y的影响显著。

t统计量 伴随概率p

另:t统计量值越大,表明该变量的影响越大。

3.预测误差的评价

均方误差: RMS =

(YYˆ)2/T

2相对均方误差:RMSP =

(1Yˆ/Y)/T

ˆ|/T 平均绝对误差:MAE =|YYˆ/Y|/T 平均相对误差:MAPE =|1YTheil不等系数:U =BP+VP+CP=偏差率+方差率+协变率

ˆ)2(SYSˆ)22(1r)SYSˆ ) ( RMS2 =(YYYY

三、特殊的回归模型

1.逐步回归——处理模型中的多重共线性问题 2.主成分回归——处理模型中的多重共线性问题 3.分类数据回归——分析属性数据的影响因素 4.Panel Data模型——处理连续观察的截面数据模型

1. 逐步回归模型

【例题3】财政收入模型(EX3)。

人均财政收入(y)、第一产业增加值(x1)、第二产业增加值(x2)、第三产业增加值(x3)、最终消费(x4)

预测模型选择过程

解释变量 x1 x2 x3 x4 R2 R2 1 2 x3 x3,x1 0.0029 (4.43) 0.0012 (4.15) 0.0048 (7.74) 0.0064 0.0056 (28.33) 0.0045 (9.29) 0.0045 (0.97) 0.99548 0.99473 0.99908 0.99872 3 x3,x2 0.0013 (0.42) 0.0038 0.99898 0.99857 4 x3,x4 -0.0062 (-1.78) 0.0024 0.99564 0.99389 5 6 x1,x2 x1,x4 0.98860 0.98405 0.99708 0.99592 (1.97) 7 x2,x4 0.0017 (1.18) 0.0032 (4.35) 0.0003 (0.12) 0.0020 (1.30) 0.0011 (2.47) 0.0006 (0.92) 0.0010 (1.01) 0.0013 (3.85) 0.0006 (0.92) 0.0051 (7.51) 0.0077 (3.37) 0.0060 (2.46) 0.0072 (2.95) (15.77) 0.0030 (5.91) -0.0014 (-0.90) 0.0031 (3.95) -0.0011 (-0.63) -0.0014 (-0.90) 0.99767 0.99674 8 x3,x1,x2 0.99925 0.99868 9 x3,x1,x4 0.99924 0.99867 10 x1,x2,x4 0.99768 0.99594 11 x2,x3,x4 0.99907 0.99838 12 x1,x2,x3,x4 0.99941 0.99861 2.主成分回归

【例题4】我国电力需求预测模型(EX4)。 Y—发电量, X1—GDP, X2—电力价格, X3—人口数,

X4—重工产值/工业产值

用GENR命令生成对数变量lnY和lnX1~lnX4

(1)将变量lnX1~lnX4作为一个数组打开,在数组窗口菜单上点击:View \\ Principal Components,得到以下视图:

其中输出结果分成两部分,第一部分的第一行是特征值,第二行和第三行分别是各个特征值所对应主成分的贡献率和累计贡献率;第二部分的各列分别是每个特征值所对应的(单位化)特征向量(如Vector1表示Z1,等等)。

(2)利用特征值检验多重共线性。此时特征值为:

13.014038,20.805414,30.173482,40.007069

其中,40,而且XX=12340.002977≈0,表明模型存在严重的多重共线性。

(3)对原始数据进行标准化处理。在EViews中可以使用以下命令生成标准化变量:

GENR ny=(lny-@mean(lny))/@stdev(lny) GENR nx1=(lnx1-@mean(lnx1))/@stdev(lnx1)

其中,@mean()、@stdev()分别是样本均值和标准差函数,ny、nx为新生成的(标准化)变量名。

(4)建立主成分回归方程。因为主成分Z1、Z2的累计贡献率已经达到95.49%,所以模型中取主成分变量Z1、Z2;根据上述主成分的输出结果和公式(3),得:

GENR Z1=-0.565348*nx1+0.315509*nx2-0.562231*nx3-0.514522*nx4 GENR Z2= 0.093390*nx1+0.927670*nx2+0.112141*nx3+0.343701*nx4

进而得到主成分回归方程为:

LS ny Z1 Z2

ny = - 0.557464*Z1 + 0.168129*Z2

t = (-20.39) (3.18)

(5)求解原始变量的回归模型。将各变量带入主成分回归方程,得:

ny = - 0.557464*Z1 + 0.168129*Z2

= - 0.557464(-0.565348*nx1+0.315509*nx2-0.562231*nx3-0.514522*nx4) + 0.168129( 0.093390*nx1+0.927670*nx2+0.112141*nx3+0.343701*nx4)

= 0.330863*nx1- 0.019917*nx2 + 0.332278*nx3 + 0.344614*nx4

再根据标准化回归系数与原模型中系数之间的关系式,

iSySibii1,2,3,4

0yixi

求得:

10.49634.0.3308630.49634(0.019917)0.17797 20.12105

0.0816670.922747同理求得:32.75569,42.66439,022.91

计算过程中使用了各个变量的标准差和均值,如下表所示:

变量

均值 标准差

lnx1 10.81067 0.922747

lnx2 4.716397 0.081667

lnx3 11.70119 0.059848

lnx4 -0.55217 0.064197

lny 9.213027 0.49634

所以,我国电力需求预测模型为:

lnQ22.910.17797lnX10.12105lnX22.75569lnX32.66439lnX4

3.分类数据回归(原理) 4.Panel Data回归模型(原理)

参考书:易丹辉《数据分析与EViews应用》,中国人大出版社软件:EViews,SPSS

因篇幅问题不能全部显示,请点此查看更多更全内容