统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与技术。统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。在整个统计分析的过程中,分析是最重要的一个环节,如果缺少这一步,会降低统计工作的作用;准确的说,没有统计分析,统计的工作就没有活力、没有发展,也就没有统计工作的意义。
采用统计分析方法进行研究,必须遵循以下几个统计学基本特征:(1)科学性;(2)直观性;(3)可重复性
统计分析除了基础的统计分析外,还包含了高级统计的知识。高级统计一般包括:回归分析、聚类分析、时间序列、生存分析、判别分析、主成分分析、因子分析、协整分析、联立方程、面板数据模型等统计分析方法。这些高级统计分析不仅包含基础的变量统计信息,还能用于对数据的分类、聚类、回归及预测。可以说高级统计分析部分应用的范围更广、使用频率更高、实际解决问题的能力更强。
统计分析方法很多,但基本方法是定量分析。然而仅仅定量分析还是不足以解决问题,所以应遵循一定的分析技巧,统计分析技巧可以按照“定性—定量—定性”的顺序,巧妙的将定量分析和定性分析结合。
1.1.算法摘要
向量自回归模型(Vector Autoregression mode)简称VAR模型,是一种常用的计量经济模型。VAR模型是用模型中所有当期变量对所有变量的若干滞后变量进行回归;VAR模型用来估计联合内生变量的动态关系,而不带有任何事先约束条件。它是自回归模型的推广,此模型目前已得到广泛应用。
向量自回归(VAR)是基于数据的统计性质建立模型,VAR模型把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。VAR模型是处理多个相关经济指标的分析与预测最容易操作的模型之一,并且在一定的条件下,多元MA和ARMA模型也可转化成VAR模型,因此近年来VAR模型受到越来越多的经济工作者的重视。
1.2算法原理
通过计算各变量的回归系数矩阵估计变量与其他滞后项的关系。主要的模型和参数估计方法为:
假设原始数据的均值为非零数u,经线性变换;将原始数据集变为新的数据集;这个数据的向量自回归模型可表示为:
p阶自回归模型
其中at为误差向量,满足:1)E(at)=0,可理解为误差项的均值为0;2)E(etet’)=O,可理解为误差项的协方差矩阵;3)E(etet-k’)=0(对所有不为0的k都满足),可理解为误差项不存在自相关关系。
参数估计可通过计算样本自协方差函数、样本自相关系数和样本偏自相关函数得到:
样本自协方差函数:
样本自相关系数:
样本偏自相关函数:
参数估计也可通过普通的最小二乘法(OLS)得到模型的一致且有效的估计量,这是因为变量的滞后值出现在等式的右边,所以不存在同期相关性问题。即使扰动误差项有同期相关,然而所有的方程有相同的回归量,故OLS仍然有效。注意,由于任何序列相关都可以通过增加更多的Wt的滞后而被消除,所以扰动项序列不相关的假设并不要求非常严格。
二算法背景向量自回归模型在1980年由计量经济学家和宏观经济学家克里斯托弗·西姆斯(Christopher Sims)提出来的。他扩充了当时只能使用一个变量的自回归模型,使变量扩充到两个及多个以上,因此经常用在多变量时间序列模型的分析中。正是由于将VAR模型引入到经济学中,推动了经济系统动态性分析的广泛应用。
三相关应用向量自回归常用于预测相互联系的时间序列系统以及分析随机扰动对变量系统的动态影响,可用于分析不同类型的随机误差项对系统变量的动态影响;当变量之间不仅存在滞后影响,而且存在同期影响关系时,适合建立向量自回归模型;综合来说向量自回归可用于分析能用向量性质分析的各个领域的数据。
四参考资料1.维基百科;
2.百度;
3.MBA智库百科(http://wiki.mbalib.com/)
4.马克威分析系统使用教程,www.tenly.com。
5.计量经济学基础(第五版),达摩达尔·N·古扎拉蒂著,中国人民大学出版社。
五实例示例为用VAR模型分析我国货币政策效应。为研究货币供应量和利率的变动对经济波动的长期影响和短期影响及其贡献度,根据1995年1季度~2004年4季度的季度数据,利用VAR(3)模型对实际GDP、实际M1和实际利率RR这3个变量之间的关系进行实证研究,其中实际GDP和实际M1以对数的形式出现在模型中,而实际利率没有取对数,由于方程右边的变量相同,所以OLS估计模型是有效的,其结果如下:
RRt=10.18+[2.08RRt-1-17.87ln(M1)t-1+15.39ln(GDP)t-1]+[-1.66RRt-2+28.39ln(M1)t-2-35.09ln(GDP)t-2]+[0.52RRt-3-9.79ln(M1)t-3+16.87ln(GDP)t-3]+e1t;
Ln(M1)t=0.31+[0.008RRt-1+1.94ln(M1)t-1-0.1ln(GDP)t-1]+[-0.002RRt-2-1.46ln(M1)t-2-0.12ln(GDP)t-2]+[0.002RRt-3+0.58ln(M1)t-3+0.08ln(GDP)t-3]+e2t;
Ln(GDP)t=0.15+[-0.004RRt-1-0.066ln(M1)t-1+1.74ln(GDP)t-1]+[0.005RRt2+0.006ln (M1)t-2-1.36ln(GDP)t-2]+[-0.002RRt-3+0.11ln(M1)t-3+0.54ln(GDP)t-3]+e3t;
尽管有几个系数不显著,我们仍然选择VAR模型的滞后阶数为3。3个方程调整的拟合优度分别为:0.986,0.999,0.998。无论如何,我们可以利用这个模型进行预测及下一步的分析。
同时,为了检验扰动项之间是否存在同其相关关系,可用残差的同期相关矩阵来描述。用ei表示第i个方程的残差,结果如下:
残差 | e1 | e2 | e3 |
e1 | 1 | -0.13 | -0.49 |
e2 | -0.13 | 1 | 0.31 |
e3 | -0.49 | 0.31 | 1 |
从表中可以看出实际GDP方程和实际利率、实际M1方程的残差项之间存在的同期相关系数比较高,进一步表明实际GDP和实际货币量M1、实际利率之间存在着同期的影响关系,尽管得到的估计量是一致估计量,但是在本例中却无法刻画它们之间的这种同期影响关系。
六输入输出输入变量类型:要求数值型变量;
输出结果:回归系数矩阵、单个方程总结、你和检验准等。
七相关条目自回归、最小二乘法
八优缺点优点:所需资料不多,可用自变量数列来进行预测。但是这种方法受到一定的限制,即必须具有自相关。这种方法只能适用于某些具有时间序列趋势相关的经济现象,即受历史因素影响较大的经济现象,如各种开采量,各种自然产量等。
缺点:对于受社会因素影响较大的经济现象,不宜采用这种方法;向量自回归是一种理论,对实际的政策建议帮助不大。