回归分析模型有哪些种类?
如果因变量是(非时间的)连续变量(即一般定量资料),设自变量的个数为k,当k=1时,回归分析的种类有:①直线回归分析;②通过直线化实现的简单曲线回归分析(以下简称为曲线拟合);③非线性曲线拟合;④一般多项式曲线拟合;⑤正交多项式曲线拟合。当k≥2时,称为多元回归分析(注:前面的④、⑤2种情况实质上是用多元回归分析仅只含1个自变量时较复杂的曲线拟合问题)。当同时对多个因变量进行回归分析时,称之为多重回归分析。在多元回归分析中,简单而又实用的则是多元线性回归分析(其中某些自变量可以是原观测指标经过某种初等变换的结果,如对数变换、开平根变换等,因为这里所说的线性是指∶函数f(x)相对于回归参数是线性的,并非相对于自变量而言)。这是本篇中要论述的问题。
如果因变量是与时间有关的连续变量且未被离散化(如:生存时间、复发时间、死亡时间等),而自变量可以是定量的,也可以是定性的。此时需用生存分析中的半参数或参数回归分析方法,将在本书第5篇中论述。
如果因变量是名义或有序变量,无论它取二个离散值(如:死与活、复发与未复发等)还是多个离散值(自变量可以是定性和定量的)时,都可选用logistic回归分析;如果把列联表中每个格内的理论频数的对数当作因变量,把分组变量(包含影响因素和观测结果变量2类)当作自变量,可用对数线性模性分析。这部分内容请参见本书第3篇中有关章节。 在自变量代表时间的情况下,通常不假定因变量y的各次观察值独立,而具有某种非独立的结构,例如构成一平稳序列。这种回归模型的研究被划入统计学的另一个重要分支──时间序列统计分析的范围