请教关于logistic回归结果解读数据预处理的问题

如何在spss进行logistic单因素回归分析-中国学网-中国IT综合门户网站-提供健康,养生,留学,移民,创业,汽车等信息
> 信息中心 >
如何在spss进行logistic单因素回归分析
来源:互联网 发表时间: 16:26:29 责任编辑:鲁晓倩字体:
为了帮助网友解决“如何在spss进行logistic单因素回归分析”相关的问题,中国学网通过互联网对“如何在spss进行logistic单因素回归分析”相关的解决方案进行了整理,用户详细问题包括:RT,我想知道:如何在spss进行logistic单因素回归分析,具体解决方案如下:解决方案1:
Logistic回归分为二值logistic回归和多值logistic回归两类。首先现实中的很多现象可以划分为两种可能,就可能应用到logistic回归。如果我们采用多个因素对0-1表示的某种现象进行因果关系解释,这两种状态分别用0和1表示,或者归结为两种状态..
1个回答1个回答1个回答1个回答1个回答1个回答1个回答1个回答1个回答1个回答
相关文章:
最新添加资讯
24小时热门资讯
Copyright © 2004- All Rights Reserved. 中国学网 版权所有
京ICP备号-1 京公网安备02号苹果/安卓/wp
积分 23, 距离下一级还需 1 积分
权限: 设置帖子权限
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
小妹最近论文中用到多元Logistic回归方法,但发现统计结果跟一般文献中所用表格不同。譬如y为Ⅰ、Ⅱ、Ⅲ,以Ⅲ为参照,我得到的结果是分别在Ⅰ、Ⅱ中的自变量的各个参数值,每个自变量又分了几级,所以得到的是几级的参数值。但别人文献中的表格则没有分几级的y或是x,都只有一级的参数值,感觉是一个总的x、y的参数值。我的导师要求我在论文中写成那些文献中的格式,但她对统计也不熟。查了好久也不知道是怎么弄的,所以在此请教各位老师。谢谢了先。
载入中......
推荐你一本书吧,spss统计应用于解析& &电子工业出版社& &何丽娟翻译& &这个书中对此有解答。
首先,你得说明你用的是什么软件,貌似spss是将最后一组(最大数目的那组)作为参照组的;其次,用不用组内分析,可在选项中指定;再次,组内分析的结果,并不影响总体分析。如果实在搞不清,将组内分析的内容删除即可,不影响总体结果的。如果用spss的话,比较方法有多种,可在相应设置中指定,具体的方法看看在线帮助即可。
我是用的SPSS16.0,找了教程来看,没有看到怎么弄啊。选了回归分析后把设置改了个遍还是没弄出来。而且我得到的结果都是分了组的,没有总的参数啊!不知道怎么弄才行。
这要自己找本书 看看了
风风雨雨过后,就会是彩虹
去spss的help的case studies中去找。
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
加入我们,立即就学扫码下载「就学」app& Join us!& JoinLearn&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师关注今日:20 | 主题:176761
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
【积分求助】请教关于logistic回归的两个问题
页码直达:
丁香园荣誉版主
这个帖子发布于5年零132天前,其中的信息可能已发生改变或有所发展。
问题已解决悬赏丁当:2
这是我先做单因素logistic回归后,对有统计学意义的自编量在进行多因素logistic回归分析,最终进入模型的变量,变量引入水准设置为p﹤0.05,剔除水准为大于0.10。现在又两个疑问: 第一,以上四个自变量,前三个是有序分类变量,但因不能证明他们的赋值是等间隔的,所以我都设置了哑变量,这样做保险一些。不知道我这样做对不对?第二,第二和第三个自变量的结果如何解释?虽然这两个自变量都纳入了方程,但他们最后一组的OR值都没有统计学意义,该怎么办?请高手不吝赐教!!!急!
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
单因素用卡方或者秩和检验就可以了
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
楼上所说的不妥。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
继续请教!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
自己回复一个吧,最近查了资料得到如下答案,对于有序分类自变量,可以先以哑变量的形式进行分析,如果相邻等级建优势比近似常数,则可以对有序变量适当赋值,以离散型定量变量引入方程;对无序多分类变量,必须以哑变量形式引入方程,并且在变量筛选中整体进/出方程。肯定了我的第一点做法。但第二点有待商榷。请高手指点一番。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
继续请教:不等间距赋值是指什么?如何操作?请指点一下?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
个人觉得这种多分类变量怎么做都不是很好,其实你解释得好,一样可以就这样,赋值只是改变直接显示的结果
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
第二和第三个变量最后的哑变量从结果看没有统计学意义,是这因为你分类后,这个属性的样本量太少了,看不出剂量反应关系。用顺序变量也做做,信息丰富一些。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
请问楼主:在logistic回归中如何进行哑变量转换?我有一组变量ER-PR-, ER+PR-, ER-PR+和ER+PR+,该如何将这4个转换成哑变量后进入logistic回归模型呢?敬请高教!谢谢!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
有点小忙,没有及时回复,抱歉哦!对于楼上的问题回复如下:不知道楼上的算到哪一步了,我从头算起吧,Analyze→ Regression→Binary Logistic:出现Logisti Regression框,在选择Dependent 和Cavariates后,Click对话框中最下面一排的“Categorical...”按钮,出现另一对话框,从左边框中选择你需要设哑变量的变量进入右边框,然后根据需要将分类变量中的第一个或最后一个设为参照选择“Last”or&First &,如果你改变了默认的“Last” ,请不要忘了click&Change&,然后→ Continue→ Ok.希望能帮到你!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
非常感谢楼主的帮助!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
在楼主的帮助下,我已设了哑变量进行分析。我是以ER(-)PR(-)为参照,只有ER(+)PR(-)与其相比有统计学差异(P=0.002; OR=0.220),而ER(-)PR(+)及ER(+)PR(+)组无统计学差异。那么在结果的解释中是否可以说ER(-)是独立危险因素?ER(-)者的危险性是ER(+)者的4.54倍(1/0.220)?PR(-)与其发病危险无关?不知道这样解释结果是否合理?急待解答!非常感谢!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
楼主您好,我想请教您两个问题1.我在做疾病的危险因子研究,搜集到病例组458人,controls组分两组,第一个387人,第二个182人,请问怎么把数据导入统计分析软件里进行分析呢。2.这个课题我是不是应该先做单因素logistical回归,然后把有意义的因素放在一起做多因素logistical 回归分析呢?不甚感激!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
第一个问题,可以在SPSS里直接录入,可以用EXCEL录入建成数据库,我习惯用epidata建数据库。你的样本量很大,建议你用epidata建库。第二个问题,一般来讲,先做单因素,有统计学意义的进入多因素方程分析。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
回答zhuangxinrong的问题,你的结果,ER(+)PR(-)组与对照组相比,是保护因素。后面ER和PR为什么分开?这样不妥吧。建议你重新分组,分为二分类,ER+和ER-;PR作同样处理。然后算他们的交互作用。用你的专业知识可以解释,我认为就可以这样分组。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
最近再次操练了Logistic回归,弄明白了以前的问题。之所以出现第二、第三个没有统计学意义,是因为属于那个哑变量的样本太少,所以区间太大,也没有统计学意义。我回头查了一下,第二个变量的最后一个哑变量只有两个人,并入另一个哑变量后,问题解决了。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
看了楼主的看法,我觉得存在一些不妥。1.先做单因素logistic回归后,有统计学意义再纳入多因素logistic分析时不妥的。做logistic回归就是为了去除其他因素对某个因素的影响,在做单因素时,无统计学意义的一个可能就是这个因素被混杂了,掩盖了其真实意义。总之,先做单因素logistic回归来进行自变量筛选是不妥的。2. 我以前跟老师讨论过自变量筛选的问题,并且我看到书上也说,不能完全依赖统计学,要加上生物学或者临床知识来考虑,例如某些因素在临床上确确实实是有意义的,无论logistic回归的P值如何,都可以强制纳入分析中。logistic回归的P值是参考依据之一,如果决定要剔除某些自变量,那根据的也是多因素的logistic,而不是单因素的logistic。3. 第2、3个自变量最后一个等级没有意义,有可能就像楼上某人说的案例数太少做不出统计学意义,但也有可能就是一个多余的分级。例如喝牛奶,分不喝、喝一点、喝很多,可能喝很多就是一个多余分级,楼主就可以考虑下把喝很多和喝一点合并为一个“喝”的等级,再试一试有没有统计学意义。希望对楼主有帮助。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
危险因素的分析是一个比较复杂的过程,既需要统计又依靠专业知识。单因素和多因素分析各有优缺点,单因素分析时研究因素有可能被其他因素混杂而变得无意义,多因素分析时由于变量间的共线性和复杂关系而使一些因素无意义,另外过多的变量会导致误差太大,模型不稳健,所以两者要结合起来使用。一般先做单因素logistic分析,这时的p值可以大些,比如选择0.1,0.2甚至0.3,然后对一些可能相关的变量进行多因素分析,研究变量之间可能的关系(我感觉这一步最麻烦),最后把单因素有意义、相关变量中作用较大的变量以专业上认为是有意义的变量都纳入多因素logistic分析。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
请楼主老师帮忙看一下这个帖子,万分感谢!!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园样本量的估计可能是临床最头疼的一件事了,其实很多的临床研究事前是从来不考虑样本量的,至少我接触的临床研究大都如此。他们大都是想到就开始做,但是事后他们会寻求研究中样本量的依据,尤其是在投文章被审稿人提问之后。可能很少有人想到研究之前还要考虑一下样本够不够的问题。其实这也难怪,临床有临床的特点,很多情况下是很难符合统计学要求的,尤其一些动物试验,可能真的做不了很多。这种情况下确实是很为难的。本篇文章仅是从统计学角度说明logistic回归所需的样本量的大致估计,不涉及临床特殊问题。其实不仅logistic回归,所有的研究一般都需要对样本量事前有一个估计,这样做的目的是为了尽可能地得出阳性结果。比如,你事前没有估计,假设你做了20例,发现是阴性结果。如果事前估计的话,可能会提示你需要30例或25例可能会得出阳性结果,那这时候你会不会后悔没有事前估计?当然,你可以补实验,但是不管从哪方面角度来讲,补做的实验跟一开始做得实验可能各种条件已经变化,如果你在杂志中说你的实验是补做的,那估计发表的可能性就不大了。一般来说,简单的研究,比如组间比较,包括两组和多组比较,都有比较成熟的公式计算一下你到底需要多少例数。这些在多数的统计学教材和流行病学教材中都有提及。而对于较为复杂的研究,比如多重线性回归、logistic回归之类的,涉及多个因素。这种方法理论上也是有计算公式的,但是目前来讲,似乎尚无大家公认有效的公式,而且这些公式大都计算繁琐,因此,现实中很少有人对logistic回归等这样的分析方法采用计算的方法来估计样本量。而更多地是采用经验法。其实关于logistic回归的样本量在部分著作中也有提及,一般来讲,比较有把握的说法是:每个结局至少需要10例样品。这里说得是每个结局。例如,观察胃癌的危险因素,那就是说,胃癌是结局,不是你的总的例数,而是胃癌的例数就需要这么多,那总的例数当然更多。比如我有7个研究因素,那我就至少需要70例,如果你是1:1的研究,那总共就需要140例。如果1:2甚至更高的,那就需要的更多了。而且,样本量的大小也不能光看这一个,如果你的研究因素中出现多重共线性等问题,那可能需要更多的样本,如果你的因变量不是二分类,而是多分类,可能也需要更大的样本来保证你的结果的可靠性。理论上来讲,logistic回归采用的是最大似然估计,这种估计方法有很多优点,然而,一个主要的缺点就是,必须有足够的样本才能保证它的优点,或者说,它的优点都是建立在大样本的基础上的。一般来讲,logistic回归需要的样本量要多于多重线性回归。最后仍然需要说一句,目前确实没有很好的、很权威的关于logistic回归样本量的估计方法,更多的都是根据自己的经验以及分析过程中的细节发现。如果你没有太大的把握,就去请教统计老师吧,至少他能给你提出一些建议。(文/图 数据小兵精选自百度文库,原百度文库作者:shiliupp)
SPSS实战案例(spsser) 
 文章为作者独立观点,不代表大不六文章网立场
的最新文章
和数据小兵学SPSS统计分析,微信订阅号:SPSS统计训练营。今天学习SPSS最优尺度回归分析案例。可以用手机看的电子书《SPSS因子分析疑难解析》来啦~游程检验是一个小巧玲珑的统计分析方法,送案例一枚,回复游程检验可下载案例数据。《SPSS统计分析深度答疑》电子书上线。要想获得满意的回答,取决于你提问的方法;号外:《SPSS篇》正式开售,欢迎选购。一个菜鸟职场新人,在没有老师指点的课堂之外,如何轻松玩得一个统计分析工具武器呢?其实关于logistic回归的样本量在部分著作中也有提及,一般来讲,比较有把握的说法是:每个结局至少需要10例样品。问卷内部一致性Cronbach信度系数α的取值范围到底是多大?课本上普遍认为α信度系数的值一般在0和1之间。但我们在实际应用当中却发现,有时a系数是一个负数,这是怎么回事呢?因子分析没有KMO值怎么办?冰柱图虽然是软件默认输出,但实际上操作者们却更愿意看树状图。树状图直观的展示了聚类的整个过程,问题是,有读者说看不明白树状图。每每谈起主成分和因子有啥区别,楼主总是有种心里大概明白,但就是说不清的感觉,终于看到一篇帖子,从十个方面阐述了两者的区别,留作纪念,同时也发给大家做个参考。排序在数据分析过程中只是一个小小的基础操作,但它是我们快速了解数据整体情况的方法之一,不容忽略。任何一个工具或者工作,存在重复劳动的环节,那么请记住,它一定也存在能提高效率的方法,只是需要我们去发现和尝试。spsser和数据小兵学SPSS,探讨业务数据分析,致力数据化运营。热门文章最新文章spsser和数据小兵学SPSS,探讨业务数据分析,致力数据化运营。

我要回帖

更多关于 logistic回归 的文章

 

随机推荐