建立logistic回归模型要求研究个体之间彼此独立,那么彼此不独立时用什么方法分析呢
1个回答
关注
展开全部
您好亲亲,线性回归的模型是求出因变量Y和自变量X之间的线性关系系数β,满足Y=Xβ,此时要求因变量Y是连续的,所以是回归模型。如果因变量Y是离散的话,需要对于这个Y再做一次函数转换,变为g(Y),如果令g(Y)的值在某个实数区间的时候是类别A,在另一个实数区间的时候是类别B,以此类推,就得到了一个分类模型。如果结果的类别只有两种,那么就是一个二元分类模型了。Logistic回归的出发点就是从这来的。
比如在信用风险控制中,违约概率的取值是多变的,通过构建虚拟变量Y,设定临界值将违约概率的取值转化为二变量,当违约概率大于临界值时,取值为1,即客户会违约,当违约概率小于临界值时,取值为0,即客户不会违约。现假设在自变量X给定的条件下因变量y=1的概率为p, 记作p=P(y=1|X), 那么y=0的概率为1-p, 把因变量取1和取0的概率比值p/(1-p)称为优势比, 对优势比取自然对数, 则可以得到Sigmoid函数:
咨询记录 · 回答于2021-11-11
建立logistic回归模型要求研究个体之间彼此独立,那么彼此不独立时用什么方法分析呢
您好,亲亲亲,这边是小王老师,您的问题我已经看到了。这边会在5分钟内为您解答
您好亲亲,线性回归的模型是求出因变量Y和自变量X之间的线性关系系数β,满足Y=Xβ,此时要求因变量Y是连续的,所以是回归模型。如果因变量Y是离散的话,需要对于这个Y再做一次函数转换,变为g(Y),如果令g(Y)的值在某个实数区间的时候是类别A,在另一个实数区间的时候是类别B,以此类推,就得到了一个分类模型。如果结果的类别只有两种,那么就是一个二元分类模型了。Logistic回归的出发点就是从这来的。比如在信用风险控制中,违约概率的取值是多变的,通过构建虚拟变量Y,设定临界值将违约概率的取值转化为二变量,当违约概率大于临界值时,取值为1,即客户会违约,当违约概率小于临界值时,取值为0,即客户不会违约。现假设在自变量X给定的条件下因变量y=1的概率为p, 记作p=P(y=1|X), 那么y=0的概率为1-p, 把因变量取1和取0的概率比值p/(1-p)称为优势比, 对优势比取自然对数, 则可以得到Sigmoid函数:
现在我要分析一个二分类的变量(是否有病)与多个个分类变量(自变量)之间的关系,本来我想用logistic回归分析,但是又想到研究个体患有某病不是独立的,那么我应该用什么方法分析呢
您好亲亲,如果是真正的二类变量(如:男女、有无,要输入为1与0),与连续变数度相关,叫「点二系列相关」(point biserial correlation),它是Pearson相关的特例,可以用SPSS的相关来求即可。 如果是人为二类变量(如:及格与不及格),与连续变数度相关,叫「二系列相关」(biserial correlation),在SPSS中无法计算,需要使用其他软件。 如果点二系列相关系数为正,表示1(如男)的成绩较高;如果系数为负(如班委),表示班委的成绩较低。
你不是做统计的吧,你是学数学的吗?完全看不懂你在说些什么
您好亲亲,以我的解答就是这样的呢,这需要您自己理解~