异质性是什么?
异质性(Heteroskedastic)
如何准确识别自变量X对因变量Y的作用?考虑到影响Y的因素有很多,不仅包括X,也包括其他因素(也即非观测因素)。为逻辑清晰起见,我们简单把非观测因素的作用归结为Z。如果X的值变化了,Z的值也随之变动,此时你观测到的Y的变动,到底是X引起的,还是Z引起的?说不清楚。
所以,逻辑上来讲,只有在Z不变的情况下,X变了,Y也变了,你才可以说,Y的变动确实是X引起的,因为此时其他因素Z是保持不变的,也就是我们通常说的“其他因素不变”。
那么,其他因素Z不变,如果其作用被吸收进误差项(因为既然Z是非观测因素,缺乏有效测量数据,那么你在计量经济模型中是只考虑X的),其在统计上的表现之一就是误差项的方差应该保持不变(当然还有其他统计上的表现,方差不变只是“其他条件不变”这一前提的统计表现之一)。因为误差项是随机因素成分,其方差不应随X的变化而表现出系统性的差别。当把Z的效应纳入误差项后,如果Z是随X变化的(就是不同的X,其他因素Z也不同),那么这样的误差项当然就表现出“异方差”了。
从另一个角度来说,同方差假设给统计推断带来便利,因为你要估计的方差数大大减少了。不管X取何值,误差项的条件方差都是一样的,否则X每取一个值,你都要去估计一个条件方差,重复测量数据还勉强可以做到,一般的横截面数据是不可能估计出这么多的误差方差的。
研究的样本的重要属性上总是存在差异(Heteroskedasticity),比如人和人之间的消费习惯可能大相径庭,这样你记录1000个人10年的月消费数据,即便他们收入流和资产完全相同,消费流也可能截然不同。在统计性质上,这种不同表现为异方差。所以在计量模型上,横截面数据和面板数据经常出现,也可以说总会存在异质性问题。
可参考景观生态学内容,书中过去指的是“景观要素”现在改成“景观组分”