周一至周五 | 9:00—22:00

期刊论文网 > 社会科学论文 > 统计学论文 > 统计学毕业论文 山东GDP时间序列平稳性检验及分析预测

统计学毕业论文 山东GDP时间序列平稳性检验及分析预测

2018-12-18 17:11:41来源:组稿人论文网作者:婷婷

  摘 要

  随着我国经济的发展,人民生活水平的提高,GDP越来越受到社会的关注。GDP是决定一个国家发展水平的重要指标。山东省作为一个人口大省,创造的经济产值在中国占有举足轻重的地位。时间序列分析是是通过观察数据,建立能够准确反映序列中所包含的动态关系的数学模型。时间序列分析是统计学重要组成部分,其应用遍及经济学,工程学,医学等各个领域,应用广泛。本文以山东国内生产总值1952—2015年统计年鉴数据为基础,运用相关的统计软件对其平稳性进行检验并分析预测未来几年山东省GDP。

  关键词:山东GDP;时间序列平稳性;统计软件;分析预测

  一、绪论

  (一)GDP研究背景

  2018年是改革开放40周年,中国经济实现质的飞跃。刚刚结束的党的十九大党习近平总书记指出,我国经济已从高速发展阶段向高质量发展阶段转变,我国现阶段正处在转变生产动力,产业结构优化的关键时期。在国民经济发展过程中,GDP是衡量一个国家综合国力的重要标志。GDP指的是在一定时期内,一个国家(或地区)创造的最终产品和劳务的价值总和。这个指标可以从整体上度量经济波动周期状态,也可以从整体上度量国民经济和收入规模。GDP成为政府部门制定经济发展战略方针的重要依据。山东省作为中国东部沿海城市,东临渤海、黄海,与朝鲜、韩国、日本隔海相望,凭借优越的地理位置以及政府的积极作为,为中国GDP做出不菲的贡献。分析山东省GDP具有重要的理论和实际意义。

  时间序列分析是动态数据处理分析的一种方法。时间序列分析就是按照时间的顺序把随机时间的变化记录下来,进行观察研究、分析规律、预测走势。是以概率论与数理统计学为理论基础分析序列走向的学科。

  经济预测是运用科学的方法,并不是通过主观臆测得出结论的科学。经济预测作为预测的分支,是指根据经济活动的历史和现实,运用定性分析和定量分析的方法揭示经济活动的客观规律,分析经济现象之间的关系和作用机制,预测经济过程的未来走势,提高政府部门决策的精度。如果将时间序列分析应用到山东省GDP当中,那么能够准确有效的预测山东省GDP未来几年的走向,为政府宏观经济调控提供理论引导。

  (二)GDP研究现状

  经济全球化的发展,国内外众多学者都在对GDP的发展变化规律进行研究探索,研究模型和方法也各有不同,近几年研究成果累累。在国内:1985年建立GDP核算制度,1992年建立新的国民经济核算制度。2009年,陈小娟建立平滑指数模型和ARIMA模型分析广东省GDP;崔博运用神经网络原理建立黑龙江省GDP模型;李小飞运用数据挖掘模型分析国内生产总值。在国外:2008年,Jens Hogrefe运用混合频率逼近法预测GDP。

  国内外对于GDP的研究仍在继续进行。

  (三)时间序列分析研究现状

  传统的时间序列分析在经济学中的应用,主要是确定型的时间序列分析,确定型的时间序列包括AR模型、MA模型、ARMA模型、ARIMA模型。随着经济的发展和社会的变迁,一些不确定的因素在生活中显得越来越重要。1970年美国统计学家Box和英国统计学家Jenkins在著作《Time Series Analysis Forecasting and Control》提出了以随机理论为依据的时间序列分析方法,首先将非平稳的时间序列转化为平稳的时间序列,然后分析自相关和偏自相关图,最后建立时间序列模型,从而提高了时间序列预测分析的精度。1982年,Robert建立ARCH(自回归条件)模型,1986年,B0llerslev建立GARCH(广义自回归条件)模型、马尔科夫过程等理论。在我国,时间序列分析方法略显陌生,直到上个世纪70年代末80年代中后期,时间序列分析才得到深入的研究和广泛的应用。

  二、GDP收集数据

  GDP是一个关系国家经济命脉的指标。几年来,山东省坚持稳中求进,经济实力愈发增强。一个国家的生产总值是由各省经济总值求和产生的,因此各省的生产总值对该省的经济发展甚至国内的经济发展都有着重要的意义。为了分析山东省生产总值的变化趋势,本文截取了山东省1952-2015年国内生产总值(GDP)(单位:亿元),并预测山东省未来三年的经济发展做出预测分析,为政府制定行之有效的经济发展战略提供依据。数据来源于国家统计局,地区统计年鉴。

  图2-1 山东地区生产总值

  (一)GDP数据预处理

  在一些观察数据的处理中,经常会把数据取对数进一步处理。原因是对数是一个在定义域内单调递增的函数,取对数后不会改变数据的相对关系,只是缩小数据的绝对差值。对数化处理有以下几点优点:(1)简化计算,缩小数据的差值,同时将乘法计算转变为加法计算;(2)对数化处理消除异方差的问题;(3)对数化后不会改变数据的性质和相关关系。因此在经济学的学习中常取对数进行预测分析。在本论文中对山东省GDP数据预处理是必不可少的环节,山东省GDP数值过于庞大,不方便计算,为了缩小数据间的绝对差值,对GDP取对数。山东省生产总值(GDP)数据预处理结果如下图2-2所示:

  图2-2 数据预处理结果-Ln(GDP)

  从图2-2中我们可看到,Ln(GDP)具有明显的逐年上升的趋势,所以可以初步认定Ln(GDP)是非平稳的时间序列。

  (二)山东省GDP时序图

  为了进一步验证山东省GDP的平稳性,我们利用R软件做出Ln(GDP)的时序图,下图

  2-3为Ln(GDP)时序图

  图2-3 Ln(GDP)时序图

  从图2-3可知,从1952年到1977年山东省Ln(GDP)为非连续的时间序列,时序图呈现点状分布,而从1975年至2015年,Ln(GDP)有明显的上升趋势,可认为时间序列是非平稳的,要想得到更准确的认识还需要其他的方法,运用其他的统计软件进行验证。

  三、GDP时间序列平稳性

  定义

  平稳性是描述时间序列状态的术语,时间序列的平稳性指的是生成变量时间序列数据的随机过程的统计规律不会随时间的推移而发生变化,这个过程叫平稳随机过程。有两种平稳,一种是严格平稳,另一种是弱平稳(广义平稳或宽平稳)。严格平稳是指随机过程的联合分布函数(概率密度函数)不随时间的变化而变化。弱平稳是指随机过程的分布特征值如期望、方差和自协方差不随时间变化而变化。

  (二)平稳性满足条件

  若满足如下三个条件,则称该时间序列的随机过程是弱平稳过程,(或协方差平稳)。

  E()=μ(均值是与时间t无关的常数);

  var()=E(-μ)=σ<(方差是与时间t无关的常数);

  cov(,)=E[(-μ)(-μ)]=(自协方差是与时间t无关,只与时间间隔k有关的常数)。

  四、GDP时间序列非平稳的来源

  (一)趋势

  时间序列的趋势包括确定性趋势和非确定性趋势。在样本容量T较小时,二者具有相类似的动态路径,但二者的概率性质是完全不相同的。

  确定性趋势:含有确定性趋势的随机过程就是非平稳的。

  随机趋势:随机趋势是比确定性趋势更常见的趋势过程。一个最简单的随机趋势过程就是随机游走,它的特点是随着时间t的增加,方差和一阶自协方差也趋于无穷大,总体自相关系数是两个无穷大量的比值,所以没有意义;另一种随机趋势是带漂移项的随机游走。期望值多加一项,它也是非平稳。需要注意的是不同平稳化方法适用于不同的趋势。对于一个趋势平稳过程进行差分是不恰当的,对一个差分平稳过程去除趋势也是不恰当的,所以对含有两种趋势的过程既需要差分处理,又需要去除趋势处理,才能使其平稳化。

  (二)结构突变

  结构突变指的是重大突发性事件(例如1978年改革开放,2008年全球经济危机)的冲击效应改变了潜在变量的数据生成过程(DGP)的趋势函数。结构突变分为在某个时刻前后的离散变化和随时间的逐渐变化两种情况。

  如果产生时间序列的随机过程至少具有一个结构突变点,等价于横截面数据样本中观测点来源于不同总体,由于数据生成过程发生了变化,直接对原时间序列进行回归分析时不恰当的。而是应该对结构突变前后的时间序列分别进行回归分析,或者采用等价的方法,将引起结构突变的虚拟变量引入模型,来反映结构突变对经济过程的影响。

  含有结构突变的时间序列数据一般自身还包含趋势(确定性趋势或随机趋势),即非平稳是由趋势和结构突变双重原因造成的。在这种情况下进行回归分析时需要首先对突变点前后的序列分别通过剔除趋势或者差分使其平稳化,避免出现伪回归,然后再进行回归分析。

  五、GDP时间序列平稳性检验

  时间序列随机趋势的检验主要有两种:一是自相关函数法;二是单位根检验法。

  (一)自相关函数法

  自相关函数法是分析时间序列的一个重要方法。自相关函数是度量随机变量在不同时刻的取值之间相互关联的程度。随着时间间隔k的增加,无论时间序列是否平稳,样本自相关曲线下降且趋近于零。但从递减的速度来看,平稳时间序列的自相关函数会随着时间长度k的增加而指数型的递减,比非平稳时间序列递减速度快得多。

  平稳时间序列的自相关函数随着间隔k的增加呈现指数型递减,由此得到判断准则:如果时间序列自相关函数很快的趋于零,则可能不存在随机趋势,时间序列是平稳的;反之可能具有随机趋势,时间序列是非平稳的。山东省Ln(GDP)的自相关图如图5-1;5-2所示:

  图5-1 自相关、偏自相关函数图 图5-2 一阶自相关、偏自相关函数图

  如图5-1表明:延迟12阶以后,自相关系数全部都衰减到2倍标准差之内波动,认为Ln(GDP)为非平稳。而从图5-2可知,Ln(GDP)序列的自相关系数很快的趋近于零,当k=2时就落入随机区域,认为Ln(GDP)时间序列是一阶平稳的。

  (二)单位根检验——DF检验法

  单位根检验就是检验时间序列中是否含有单位根,如果存在单位根就说明该时间序列是非平稳的。1976年富勒用最小二乘法做回归分析并计算出了期望及方差的估计量。之后构造t统计量来进行单位根存在性检验,这就是DF检验。迪基-富勒(DF)检验法在20世纪70,80年代是由迪基和富勒建立起来的。DF检验法只适合于AR(1)模型。

  而后推广出ADF检验法,适合AR(p)模型。ADF检验有三种类型:

  (1)无均值、无趋势的自回归过程

  (2)有均值、无趋势的自回归过程

  (3)有均值、有线性趋势的自回归过程

  :时间序列是非平稳的。利用Eviews6.0做出山东省Ln(GDP)单位根检验结果图,如图5-3;5-4所示:

  图5-3 单位根检验结果 图5-4 一阶单位根检验结果

  由图5-3可知:Ln(GDP)的概率P值=0.744,大于1%、5%、10%下的显著水平,接受原假设,认为其Ln(GDP)时间序列存在单位根,本身不是平稳的;由图5-4可知:Ln(GDP)的概率P值=0.0028小于1%、5%、10%下的显著水平,拒绝原假设,认为Ln(GDP)时间序列不存在单位根,其一阶差分是平稳的。

  六、山东省GDP的单整过程

  处理随机趋势的可靠方法是对序列进行变换,消除其中的随机趋势成分,使其平稳化。单整过程是处理伪回归的一种方式。单整阶数是指使时间序列平稳而进行差分的次数,如果一个时间序列经过一次差分变为平稳,称为一阶单整,记为(1);若经过d次差分平稳,记为(d)。通常认为单整过程是指单整阶数大于零的过程,即具有随机趋势的非平稳过程。由单整产生的时间序列称为单整序列。

  由上图4-3;4-4单位根检验结果可知,其Ln(GDP)时间序列本身非平稳,而其一阶单位根是平稳的,像这种经过一次差分之后变平稳的过程,我们称该过程是一阶单整的,记为~(1)。

  七、时间序列分析的常用模型

  确定性的时间序列分析常用模型有AR(自回归)模型、MA(移动平均)模型、ARMA(自回归移动平均)模型、ARIMA(求和自回归移动平均)模型。

  (一)AR模型

  自相关平均模型:,简记为AR(p)模型。式中为模型参数;为白噪声序列;p为模型的阶数。

  MA模型

  移动平均模型:,简记为MA(q)模型。式中为模型参数;为白噪声序列;q为模型的阶数。

  ARMA模型

  自回归移动平均模型:,简记为ARMA(p,q)模型。式中,为模型参数;为白噪声序列;p,q为模型的阶数。

  综合考察AR(p)模型、MA(q)模型、ARMA(p,q)模型的自相关系数和偏自相关系数,可以得到以下规律:如图7-1所示

  图7-1ARMA模型定阶的基本原则

  (四)ARIMA模型

  求和自回归移动平均模型:,简记为ARIMA(p,d,q)模型。

  式中,;,为平稳可逆ARMA(p,q)模型的自回归系数多项式;,为平稳可逆ARMA(p,q)模型的移动平滑系数多项式。

  八、建立模型

  时间序列为非平稳时建立模型会产生一些不利的影响:导致回归系数的OLSE有偏、导致检验统计量非标准、导致伪回归。经过以上方法的验证我们得到Ln(GDP)为一阶平稳的。

  由图5-2一阶自相关图和偏自相关图可知:自相关图显示延迟1阶以后,自相关系数全都衰减到2倍标准差内波动,几乎95%的自相关系数都落在2倍标准差以内,这表明山东省GDP时间序列具有明显的短期相关性,而且通常为非零自相关系数衰减为小值的过程中相当连续,相当缓慢,该自相关系数可视为拖尾;偏自相关系数图表现除前2阶的偏自相关系数显著大于2倍标准差以外,其他偏自相关系数都在2倍标准差以内做小值的随机波动,并且由非零相关系数衰减为小值波动的过程非常突然,因此该偏自相关系数可视为2阶截尾。按照图7-1 ARMA模型定阶的基本原则,综合考虑拟合模型AR(2)。

  AR模型:

  (一)模型参数估计

  根据图5-2相关图我们确定模型为AR(2)模型,利用Eviews6.0软件建立模型估计参数。

  图8-1 一阶单位根检验结果

  综上建立模型 ,AR模型:

  等价于

  (二)模型显著性检验

  为了检验整个模型对信息的提取是否充分,我们对参数和残差进行显著性检验,为了检验模型是否最简,我们采用Q统计量对残差序列进行独立性检验。

  假设:残差序列中之间相互独立。

  检验统计量Q:。若,则接受原假设,认为山东省GDP的残差序列是独立平稳的。

  通过Eviews6.0,我们可以看到,在图5-1;5-2自相关检验图中,Q统计量的P值都远远大于0.05,信息提取比较充分,说明参数显著;对残差序列平稳性和随机性如下图8-2所示:

  图8-2 模型残差的相关性检验

  从图8-2可知:对Ln(GDP)的残差序列进行白噪声检验,它的自相关系数和偏自相关系数都没有显著异于零,Q统计量的P值除了第一项都远远大于0.05,因此认为残差序列为白噪声序列,模型信息提取比较充分。

  综上,对参数和残差的检验可知,整个模型比较精简,模型较优。

  分析预测

  所谓预测,就是要利用序列已经观测到的样本值对序列在未来的某个时刻的取值进行估计。

  (一)山东省GDP预测值

  已知山东Ln(GDP)近似服从AR(2)模型:,已知2013年、2014年、2015年的Ln(GDP)分别为10.91926736亿元、10.99249705亿元、11.05092699亿元,可以预测2018年的山东省生产总值。

  2016年:

  2017年:

  2018年:

  (二)山东省GDP的预测方差

  根据Green公式得出:

  则,

  预测2018年山东省GDP的95%的置信区间:

  带入数值可知,2018年山东Ln(GDP)95%的置信区间为(-271.6805,386.05491)。

  由以上式子可知,2018年山东Ln(GDP)是114.37441亿元,95%的置信区间为(-271.6805,386.05491),则GDP预测值为461259.10亿元。由预测值可知,山东省生产总值呈现增长趋势,增长量也逐年增加。

  十、结论

  本文选取1952-2015年山东省国内生产总值作为研究对象,利用Eviews6.0软件及R软件进行深入分析得出以下结论:

  (1)对于数据较大难以分析时,会对观察数据对数化处理。山东省GDP时间序列对数化处理的时序图是非平稳的,说明GDP是非平稳的。时序图的转折点在1978年,说明1978年后改革开放经济显著增长,改革开放效果显著。(2)分析时序图、自相关图、偏自相关图可以直观的发现山东省时间序列是非平稳的,以及可以有效的做出AR(2)模型。(3)通过模型可以分析预测山东省GDP的未来预测值和预测区间。预测经济发展的动向。

  十一、促进山东经济发展的建议

  推动经济高速发展,是新常态下的根本取向,当前,山东省的发展有目共睹,新时代下对山东省提出了更高的要求,要坚持新的发展理念,大力推进供给侧改革,加快质量改革,效率改革,动力改革。发展绿色经济,发展绿色GDP是当务之急。大力引进外资,发展向外型经济。政府采用先进的科学技术和管理经验,积极吸纳人才。

  十二、总结

  GDP是我国经济发展的主要指标,它受消费、投资、净出口等因素的影响。平稳性对于时间序列分析的直观意义就是,只有生成时间序列的随机过程是平稳的,我们才能使用过去的事实(规律)去推断未来。

  平稳性假设是为了满足在大样本分析中,OLS估计量仍然能有良好的性质。平稳性比较常见的解释是:随机变量的统计特性不随时间改变。仅为我们可以用每个样本是估计总体均值。如果样本时间序列均值、方差、协方差非常数,则这样一个过于独特的时间序列无法预测未来,我们便称这样的时间序列是非平稳的。

  运用各种方法,各种检测手段,各种建模途径,使得时间序列变得平稳,并且能预测未来时刻的取值。使用时间预测法对GDP进行预测比较准确,可靠同时也弥补了其他方法的不足。由此可见时间序列分析对GDP的研究起着关键的作用。

栏目分类