您确定要删除吗?

取消
首页 算法大全 应用模型 分析软件 算法学院数据中心 关于本站
在线咨询
400-820-6981
意见反馈
返回顶部

面板数据模型

统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与技术。统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。在整个统计分析的过程中,分析是最重要的一个环节,如果缺少这一步,会降低统计工作的作用;准确的说,没有统计分析,统计的工作就没有活力、没有发展,也就没有统计工作的意义。

采用统计分析方法进行研究,必须遵循以下几个统计学基本特征:(1)科学性;(2)直观性;(3)可重复性

统计分析除了基础的统计分析外,还包含了高级统计的知识。高级统计一般包括:回归分析、聚类分析、时间序列、生存分析、判别分析、主成分分析、因子分析、协整分析、联立方程、面板数据模型等统计分析方法。这些高级统计分析不仅包含基础的变量统计信息,还能用于对数据的分类、聚类、回归及预测。可以说高级统计分析部分应用的范围更广、使用频率更高、实际解决问题的能力更强。

统计分析方法很多,但基本方法是定量分析。然而仅仅定量分析还是不足以解决问题,所以应遵循一定的分析技巧,统计分析技巧可以按照“定性—定量—定性”的顺序,巧妙的将定量分析和定性分析结合。

算法描述

1.1.算法摘要

面板数据也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。可以用于处理时间和截面空间上取得的二维数据;这种数据从横轴上看,是由若干个体在某一时刻构成的截面记录值,从纵轴上看是个时间序列数据。而且面板数据模型还可以处理非平衡面板数据,即:面板数据中缺少了某些横截面的一些数据。

面板数据分为两种特征:1)个体数少,时间长;2)个体数多,时间段。一般的面板数据主要指的是第二种情形。

1.2.算法原理

1.2.1 面板数据的分类

面板数据的模型根据截距项向量和系数向量中各分量的不同限制要求,可以分为3种类型:无个体影响的不变系数模型、变截距模型、含有个体影响的变系数模型。

1)无个体影响的不变系数模型(混合效应模型)

模型的表达式为:,i = 1,2,…,N;在该模型中,假设在个体成员上既无个体影响也没有结构变化,即对于各个成员方程,截距项维系数向量均相同。对于该模型,将各个成员的时间序列数据堆积在一起作为样本数据,利用普通最小二乘法便可求出参数的一致有效估计。因此该模型也被称为混合回归模型(pooled regression model)。

2)变截距模型

模型表达式为: ,i = 1,2,…,N;在该模型中,我们假设在个体成员上存在个体影响而无结构变化,并且个体影响可以用截距项(i=1,2,…,N)的差别来说明,即在该模型中各个成员方程的截距项不同,而维系数向量相同,故称该模型为变截距模型。从估计方法角度,也称该模型为个体均值修正回归模型(individual-mean corrected regression model)。

3)含有个体影响的变系数模型

模型表达式为:,i = 1,2,…, N;在该模型中,假设个体成员上既存在个体影响,又存在结构变化,即在允许个体影响由变化的截距项(i=1,2,…,N)来说明的同时还允许维系数向量(i=1,2,…,N)依个体成员的不同而变化,用以说明个体成员之间的变化。我们称该模型为变系数模型或无约束模型(unrestriced model)。

1.2.2 面板数据的分析方法

面板数据模型能够处理时间序列的二维数据模型,选择合适的模型,能构对时间序列数据进行回归分析。

进行面板数据处理的分析方法可以归结为:

1)用单位根检验分析数据的平稳性(单位根检验)。

经济时间序列的数据往往具有平稳和非平稳类型,而面板数据模型分析的前提是序列具有平稳性,如果对非平稳数据处理,可能会得到伪回归的情况。所以可对面板数据进行LLC单位根检验,单位根不存在则序列平稳,否则要先对数据做差分,使其平稳。在检验时可以先对面板序列数据绘制时序图,观察时序图中由各个观测值描绘出代表变量的折线是否含有趋势项和截距项,从而为单位根检验模式做准备。

2)协整检验或模型修正。

如果发现变量之间是同阶单整的,可用协整检验考察变量之间长期的均衡关系;若果经过单位根检验发现变量之间是非同阶单整的,可在不改变变量经济意义的前提下,对数据进行差分化,消除数据不平稳对回归造成的不利影响。

3)面板模型的选择与回归。

面板数据模型的选择通常包含三种形式:混合估计模型、固定效应模型和随机效应模型。其中混合效应模型的斜率项和截距项都是相同的,可用最小二乘法估计参数;固定效应和随机效应模型的斜率项相同,但截距项不同,可以在模型中添加虚拟变量的方法估计参数。随机效应模型是在截距项中包含了截面随机误差项和时间随机误差项的固定效应模型。

1.2.3 面板数据模型的假设检验

要确定面板数据用哪种形式的回归模型,必须先对样本数据进行检验;以确定面板数据究竟符合哪种面板数据模型形式,从而避免模型设定的偏差,改进参数估计的有效性。

经常使用的检验是协方差分析检验,主要检验如下两个假设:

可见如果接受假设H2则可以认为样本数据符合情形1,即模型为不变参数模型,无需进行进一步的检验。

如果拒绝假设H2,则需检验假设H1。如果接受H1,则认为样本数据符合情形2,即模型为变截距模型,反之拒绝H1,则认为样本数据符合情形3,即模型为变参数模型。

可以用F检验决定选用混合模型还是固定效应模型,然后用Hausman检验确定用随机效应模型还是固定效应模型。

设检验的F统计量的计算方法。首先计算情形 (变参数模型)的残差平方和,记为S1;情形 (变截距模型)的残差平方和记为S2;情形 (不变参数模型)的残差平方和记为S3。计算F2统计量:

在假设H2下检验统计量F2服从相应自由度下的F分布。若计算所得到的统计量F2的值不小于给定置信度下的相应临界值,则拒绝假设H2,继续检验假设H1。反之,接受H2则认为样本数据符合模型情形1,即不变参数模型。

在假设H1下检验统计量F1也服从相应自由度下的F分布,即:

若计算所得到的统计量F1的值不小于给定置信度下的相应临界值,则拒绝假设H1。

如果接受H1,则认为样本数据符合情形2,即模型为变截距模型,反之拒绝H1,则认为样本数据符合情形3,即模型为变参数模型。

算法背景

面板数据分析方法是最近几十年发展起来的新的统计方法,其卡伊克服时间序列分析受多重共线性的困扰,能够提供更多的信息、更多的变化、更少共线性、更高自由度和更高的估计效率,面板数据的单位根检验和协整分析也是当前最前沿的领域。

相关应用

面板数据模型可以应用在计量经济学领域中,主要用来描述时间序列数据中自变量与因变量的回归关系。

由于经典线性计量经济学模型在分析时只利用了时间序列或截面数据中的某些二维数据信息,在很多时候往往不能满足人们分析问题的需要。例如,在生产函数的分析中,仅利用横截面数据只能对规模经济进行分析,仅利用混有规模经济和技术革新信息的时间序列数据只有在假设规模收益不变的条件下才能实现技术的革新的分析,而利用时间序列和截面数据可以同时分析企业的规模经济(选择同一时期的不同规模的企业数据作为样本观测值)和技术革新(选择同一企业的不同时期的数据作为样本观测值)。

参考资料

1.维基百科;

2.百度;

3.MBA智库百科(http://wiki.mbalib.com/)

4.马克威分析系统使用教程,www.tenly.com。

5.计量经济学导论(第五版),杰弗里·M·伍德里奇著,中国人民大学出版社。

实例

根据凯恩斯的绝对收入假说:凯恩斯认为消费主要取决于消费者的净收入,边际消费倾向小于平均消费倾向,边际消费倾向会随着收入的增加而减少,平均消费倾向也会随着收入的增加而减少,人们的现期消费,取决于他们现期收入的绝对量。本案例收集了中国15个省市,1996-2002年的居民收入与消费数据,目的为分析居民消费在空间(截面)和时间(时期)上的差异性。

其中obs表示各省市按年的编号,CP表示居民消费数据,IP表示居民收入数据,各省市都按各自的中文名缩写表示;部分数据展示如下:

obs CP IP
AH-1996 3282.466 4106.251
AH-1997 3646.15 4540.247
AH-1998 3777.41 4770.47
AH-1999 3989.581 5178.528
AH-2000 4203.555 5256.753
AH-2001 4495.174 5640.597
AH-2002 4784.364 6093.333
ZJ-1996 5342.234 6446.515
ZJ-1997 6002.082 7158.288
ZJ-1998 6236.64 7860.341
ZJ-1999 6600.749 8530.314
ZJ-2000 6950.713 9187.287
ZJ-2001 7968.327 10485.64
ZJ-2002 8792.21 11822

利用面板数据模型第一步应该检验样本数据究竟符合哪一种模型,是混合效应模型、变截距模型还是变系数模型。要进行检验,先计算三种模型的残差平方和,结果如下:混合模型=7943696;变截距模型=202856;变系数模型=1176023。K=1,N=29

首先检验

检验的计算结果为:F2=8.63>F(56,58)=1.55;拒绝接受H2,继续对H­1进行检验,计算的结果F1=1.502<F(28,58)=1.67,所以接受H1,模型采用变截距形式的模型。

接下来进行Hausman检验,该检验的原假设为个体影响与解释变量不相关(随机模型),检验计算结果为:P=0.0316<0.05;故拒绝原假设,应该使用固定效应模型。之后可以进行检验该面板数据的特征及相关统计量。

输入输出

输入变量类型:要求数值型变量;如:整型、浮点型

输出结果:面板数据的相关统计量。

相关条目

时间序列、最小二乘法

优缺点

优点:可以控制个体异质性;面板数据模型容易避免多重共线性问题;面板数据更适合于研究动态调整过程;与纯横截面数据或时间序列数据相比,面板数据模型允许构建并检验更复杂的行为模型;基于个体、企业或家庭所搜集的微观面板数据与在宏观层次上所搜集的类似变量相比更加准确,而且还可能消除企业或个体数据汇总所导致的偏;

缺点 :微观调查面板数据极少;测量误差的扭曲(distortions)严重 ;面板数据调查的样本选择问题;时间维度短 ;截面相关性 。

确定