确定AR模型的阶数
2020-01-18 · 技术研发知识服务融合发展。
通常事先并不知道AR模型的阶数。阶数选得太低,功率谱受到的平滑太大,如图4-4(c)所示,真实谱(左边)是两个实正弦信号的谱峰和噪声的谱,平滑后的谱已经分辨不出真实谱中的两个峰了。阶数选得太高,固然会提高谱估计的分辨率,但同时又会产生谱的虚假细节或虚假谱峰,如图4-4(d)所示,由于AR模型的阶数选得太高,极点太多,因而出现了许多虚假谱峰。所以,应适当选择AR(k)模型的阶数,使k≥p,但不能太大。
当选择k>p时,如果自相关函数的估计是精确的,那么AR(k)模型参数的估计为
地球物理信息处理基础
图4-4
(a)真实功率谱;(b)阶数选得恰当;(c)阶数选得太低;(d)阶数选得太高
式中ap,i是模型参数的精确值。这样,用AR(k)模型能够得到AR(p)过程的精确谱估计(k>p)。但实际上自相关函数估计是有误差的,因而不可避免地会在谱估计中引入虚假细节或虚假谱峰。那么AR模型的阶数究竟选得高一些好还是低一些好呢?这主要应从谱估计的质量来考虑。例如,要估计一个宽带AR过程的功率谱时,模型的阶数选低一些固然会使真实谱受到一定程度的平滑,但与选择过高的阶数引起虚假谱峰相比,前者能使人更容易接受一些。采用AR模型谱估计方法,既要估计AR模型参数,又要估计模型的阶数,在这样复杂的情况下,如何评价各种谱估计的性能,目前尚无定论。一种简单而直观的确定AR模型阶数的方法,是不断增加模型的阶数,同时观察预测误差功率,当其下降到最小时,对应的阶数便可选定为模型的阶数。但是预测误差功率(或AR模型激励源的方差
除上述一般方法外,还有以下几种不同的误差准则作为确定模型阶数的依据。
(1)最终预测误差(FPE)准则(Final Prediction Error Criterion)
FPE是日本学者赤池(Akaike H)提出的判别准则,采用估计均方误差来判别,即预测误差滤波器输出的均方值
地球物理信息处理基础
它是AR(k)过程中不可预测(新息)部分的功率与AR参数估计不精确产生的误差功率之和。上式中N是采样点数,括号内的数值随着k的增大(趋近于N)而增加,这说明预测误差功率估计的不精确性在增加。由于
(2)Akaike信息论准则(AIC)(Akaike Information Criterion)
这是利用最大似然法推出的一个准则。对于高斯分布ARMA(p,q)过程,AIC定义为
地球物理信息处理基础
式中
对AR或MA过程,AIC定义为
地球物理信息处理基础
式中 i 是假设的 AR 或 MA 模型的阶数。显然,无论对于式(4-57)还是式(4-58),AIC都有一个最小值,它所对应的阶数就是要选择的阶数。
图4-5 AIC与模型阶的关系(N=100)
例如,有一AR(2)过程,差分方程为 x(n)=1.34x(n-1)-0.9025x(n-2)+w(n),设用Burg算法(将在Burg法中介绍)估计AR参数,于是有
地球物理信息处理基础
注意,由于
可以证明,N→∞时FPE和AIC等效。AIC不是一致估计,即当N→∞时,误差概率不趋于零。因此,建议在处理短数据记录时采用AIC。
(3)自回归传输函数(CAT)判别准则(Criterion Autoregressive Transfer Function)
这一准则是由Parzen在1976年提出的,定义为
地球物理信息处理基础
式中
用FPE、AIC和CAT估计AR模型的阶数,所得到的谱估计结果常常没有多大区别,特别是应用于实际数据而不是模拟AR过程数据时更是如此。同时还发现,对于短数据段,以上准则都不理想。在实际运用这些准则时,还应该参照实验结果对模型的阶数加以适当调整。估计阶数的上界与观测样本的长度之间的关系为:估计阶数上界约为N/2 或N/3 或N1/2。