实验七 虚拟变量
【实验目的】
掌握虚拟变量的设置方法。 【实验内容】
一、试根据表7-1的1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料建立我国城镇居民彩电需求函数;
表7-1 我国城镇居民家庭抽样调查资料 收入等级 困难户 最低收入户 低收入户 中等偏下户 中等收入户 中等偏上户 高收入户 最高收入户 彩电拥有量Y (台/百户) 83.64 87.01 96.75 100.9 105.89 109.64 115.13 122.54 人均收入X (元/年) 2198.88 2476.75 3303.17 4107.26 5118.99 6370.59 7877.69 10962.16 Di 0 0 0 1 1 1 1 1 XDi 0 0 0 4107.26 5118.99 6370.59 7877.69 10962.16 资料来源:据《中国统计年鉴1999》整理计算得到
二、试建立我国税收预测模型(数据见实验一);
三、试根据表7-2的资料用混合样本数据建立我国城镇居民消费函数。 表7-2 我国城镇居民人均消费支出和可支配收入统计资料 收入等级 困难户 最低收入户 低收入户 中等偏下户 中等收入户 中等偏上户 高收入户 最高收入户 1998 消费支出Y 2214.47 2397.6 2979.27 3503.24 4179.64 4980.88 6003.21 7593.95 收入X 2198.88 2476.75 3303.17 4107.26 5118.99 6370.59 7877.69 10962.16 D 0 0 0 0 0 0 0 0 消费支出Y 2327.54 2523.1 3137.34 3694.46 4432.48 5347.09 6443.33 8262.42 1999 收入X 2325.7 2617.8 3492.27 4363.78 5512.12 6904.96 8631.94 12083.79 D 1 1 1 1 1 1 1 1 资料来源:据《中国统计年鉴》1999-2000整理计算得到
【实验步骤】
一、我国城镇居民彩电需求函数 ⒈相关图分析;
键入命令:SCAT X Y,则人均收入与彩电拥有量的相关图如7-1所示。 从相关图可以看出,前3个样本点(即低收入家庭)与后5个样本点(中、
.
整理
高收入)的拥有量存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下:
1D0中、高收入家庭
低收入家庭
图7-1 我国城镇居民人均收入与彩电拥有量相关图
⒉构造虚拟变量;
方式1:使用DATA命令直接输入;
方式2:使用SMPL和GENR命令直接定义。 DATA D1 GENR XD=X*D1 ⒊估计虚拟变量模型: LS Y C X D1 XD
再由t检验值判断虚拟变量的引入方式,并写出各类家庭的需求函数。 按照以上步骤,虚拟变量模型的估计结果如图7-2所示。
图7-2 我国城镇居民彩电需求的估计
.
整理
我国城镇居民彩电需求函数的估计结果为:
ˆi57.610.0119xi31.8731Di0.0088XDi yt (16.249)(9.028) (8.320) (-6.593)
R2=0.9964 R2=0.9937 F=366.374 S.E=1.066
虚拟变量的回归系数的t检验都是显著的,且模型的拟合优度很高,说明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异,所以以加法和乘法方式引入虚拟变量是合理的。低收入家庭与中高收入家庭各自的需求函数为:
低收入家庭:
ˆi57.610.0119xi y中高收入家庭:
ˆi 57.6131.87310.01190.0088xi89.480.003xi y由此可见我国城镇居民家庭现阶段彩电消费需求的特点:对于人均年收入在3300元以下的低收入家庭,需求量随着收入水平的提高而快速上升,人均年收入每增加1000元,百户拥有量将平均增加12台;对于人均年收入在4100元以上的中高收入家庭,虽然需求量随着收入水平的提高也在增加,但增速趋缓,人均年收入每增加1000元,百户拥有量只增加3台。事实上,现阶段我国城镇居民中国收入家庭的彩电普及率已达到百分之百,所以对彩电的消费需求处于更新换代阶段。
二、我国税收预测模型
要求:设置虚拟变量反映1996年税收政策的影响。
方法:取虚拟变量D1=1(1996年以后),D1=0(1996年以前)。 键入命令:GENR XD=X*D1
LS Y C X D1 XD
则模型估计的相关信息如图7-3所示。
图7-3 引入虚拟变量后的我国税收预测模型
.
整理
我国税收预测函数的估计结果为:
ˆi1234.2680.08286xi8195.198Di0.12139XDi yt (24.748) (47.949) (-10.329) (11.208)
R2=0.9990 R2=0.9987 F=3332.429 S.E=87.317
可见,虚拟变量的回归系数的t检验都是显著的,且模型的拟合优度很高,说明1996年的税收政策对税收收入在截距和斜率上都产生了明显影响。
1996年前的税收函数为:
ˆi1234.2680.08286xi y1996年后的税收函数为:
ˆi6960.930.20425xi y由此可见,在实施1996年的税收政策前,国内生产总值每增加10000元,税收收入增加828.6元;而1996年后,国内生产总值每增加10000元,税收收入则增加2042.5元,因此,1996年的税收政策大大提高了税收收入水平。
三、我国城镇居民消费函数 要求:
⒈利用虚拟变量分析两年的消费函数是否有显著差异; ⒉利用混合样本建立我国城镇居民消费函数。 设1998年、1999年我国城镇居民消费函数分别为: 1998年:yia1b1xii 1999年:yia2b2xii 为比较两年的数据,估计以下模型: yia1b1xiDiXDii
其中,a2a1,b2b1。具体估计过程如下:
CREATE U 16 建立工作文件 DATA Y X
(输入1998,1999年消费支出和收入的数据,1-8期为1998年资料,9-16期为1999年资料)
SMPL 1 8 样本期调成1998年 GENR D1=0 输入虚拟变量的值 SMPL 9 16 样本期调成1999年 GENR D1=1 输入虚拟变量的值 SMPL 1 16 样本期调成1998~1999年 GENR XD=X*D1 生成XD的值 LS Y C X D1 X D 利用混合样本估计模型
.
整理
则估计结果如图7-4:
图7-4 引入虚拟变量后的我国城镇居民消费模型
ˆi924.705880.6237xi61.1917Di0.0080XDi yt (10.776) (43.591) (0.510) (-0.417)
R2=0.9972 R2=0.9965 F=1411.331 S.E=113.459
根据t检验,D和XD的回归系数均不显著,即可以认为a2a1=0,
b2b1=0;这表明1998年、1999年我国城镇居民消费函数并没有显著差异。因此,可以将两年的样本数据合并成一个样本,估计城镇居民的消费函数。
独立样本回归与混合样本回归结果如图7-5~图7-7所示。
图7-5 1998年样本回归的我国城镇居民消费模型
.
整理
图7-6 1999年样本回归的我国城镇居民消费模型
图7-7 混合样本回归的我国城镇居民消费模型
将不同样本估计的消费函数结果列在表7-3中,可以看出,使用混合回归明显地降低了系数的估计误差。
表7-3 利用不同样本估计的消费模型 样本 1998~1999年 1998年 1999年 ˆ a955.67 924.71 985.9 ˆ b0.6195 0.6237 0.6157 ˆ Sa55.91 86.43 83.21 ˆ Sb0.0089 0.0144 0.0127 R2 0.9971 0.9968 0.9974
.
因篇幅问题不能全部显示,请点此查看更多更全内容