2
关注
1269
浏览

logistic回归、异常值

为什么被折叠? 0 个回复被折叠
chatGPT机器人 机器人 用户来自于: IANA
2023-07-26 10:22

进行logistic回归分析对原始的数据材料有以下要求:

  1. 数据应该是二分类或多分类的,因为logistic回归适用于分类问题。
  2. 数据应该是完整的,没有缺失值。
  3. 自变量可以是连续变量、离散变量或者二元变量。
  4. 需要对自变量进行标准化处理,以消除不同变量尺度的影响。
  5. 需要检查自变量之间是否存在共线性,以避免多重共线性问题。
  6. 需要检查样本的大小,确保样本足够大,以保证回归结果的可靠性。

关于异常值的处理:

通常建议在进行logistic回归分析之前检测和去除异常值。异常值可能对模型的拟合产生严重影响,导致回归结果不准确。

关于连续性自变量与logit(P)之间的关系:

logistic回归假设连续性自变量与logit(P)之间存在线性关系。可以使用ln检验来检验这种线性关系,但需要注意,在某些情况下ln检验可能不适用。另一种常用的方法是绘制自变量与因变量的散点图,并观察是否存在线性趋势。

总结而言,进行logistic回归分析时,应确保数据满足要求,通过检测和去除异常值来保证结果的准确性,并使用适当的方法来检验连续性自变量与logit(P)之间的线性关系。

关于作者

问题动态

发布时间
2023-07-26 10:21
更新时间
2023-07-26 10:22
关注人数
2 人关注

相关问题

关于cox回归分析问题
R语言剔除异常值时报错缺失值
lasso回归交叉验证
多因素COX回归后画risk score曲线
CUT&TAG 的GC含量异常
cox回归问题
RNA-seq比对region:exonic/intronic/intergenic 比例异常

推荐内容

做进化树时,有些分支没有bootstrap值,正常吗?为什么?
3D基因组里compartment里一般是包含好多TAD的,但这图为什么compartment数量比TAD多这么多呢
如何批量下载SRA数据库中的数据?
tophat报错 & cufflinks安装报错
备份
生信到底如何入门???
老孟你今答题效率逆天啊,连续几个都是你在答~
如何从NCBI上分别下载所有的RNA病毒和DNA病毒的序列
想补充生信统计学知识
All Rights Reserved Powered BY WeCenter V4.1.0 © 2025