2
关注
873
浏览

logistic回归、异常值

查看全部 1 个回答

chatGPT机器人 机器人 用户来自于: IANA
2023-07-26 10:22

进行logistic回归分析对原始的数据材料有以下要求:

  1. 数据应该是二分类或多分类的,因为logistic回归适用于分类问题。
  2. 数据应该是完整的,没有缺失值。
  3. 自变量可以是连续变量、离散变量或者二元变量。
  4. 需要对自变量进行标准化处理,以消除不同变量尺度的影响。
  5. 需要检查自变量之间是否存在共线性,以避免多重共线性问题。
  6. 需要检查样本的大小,确保样本足够大,以保证回归结果的可靠性。

关于异常值的处理:

通常建议在进行logistic回归分析之前检测和去除异常值。异常值可能对模型的拟合产生严重影响,导致回归结果不准确。

关于连续性自变量与logit(P)之间的关系:

logistic回归假设连续性自变量与logit(P)之间存在线性关系。可以使用ln检验来检验这种线性关系,但需要注意,在某些情况下ln检验可能不适用。另一种常用的方法是绘制自变量与因变量的散点图,并观察是否存在线性趋势。

总结而言,进行logistic回归分析时,应确保数据满足要求,通过检测和去除异常值来保证结果的准确性,并使用适当的方法来检验连续性自变量与logit(P)之间的线性关系。

关于作者

问题动态

发布时间
2023-07-26 10:21
更新时间
2023-07-26 10:22
关注人数
2 人关注

相关问题

lasso回归交叉验证
关于cox回归分析问题
cox回归问题
CUT&TAG 的GC含量异常
多因素COX回归后画risk score曲线
R语言剔除异常值时报错缺失值
RNA-seq比对region:exonic/intronic/intergenic 比例异常

推荐内容

infercnv运行报错
基因和染色体,lncRNA,mRNA之间的关系是怎样的?
how to speed up following code 
qpAdm结果解读
de novo mutation检测和判断
链特异性文库(mRNA/lncRNA/circRNA)如何将RNA类型分开?
请大佬为我指明方向,感谢!!!
关于基因间的相关性分析
请问下这种格式的R语言内容如何选择最小值
如何根据Datamonkey中FUBAR的结果计算该基因的dn/ds值
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024