变量,自变量为分类变量,可否进行多个自变量相关性分析析

关注今日:2 | 主题:207196
微信扫一扫
一个分类变量和一个连续型变量怎么做相关分析?多重线性回归中的自变量可以都是哑变量吗?
页码直达:
求教大神们,一个分类变量(每月可支配资金,~1000,~2000,……~4000,&4000)(这样的变量是分类吧?还是等级变量?这里有点晕)和一个连续型变量(主观幸福感的得分)怎么做相关呢?假设上面两个变量有关联,我再做回归,回归方程里能全是哑变量吗?如果可以都是哑变量,那参考变量的选择有什么要求或标准吗?回归方程的形式是y=a0+a1 x1+a2 x2+a3 x3+a4 x4 吗?那参考变量怎么表现出来呢?当每月可支配资金&4000时,y=a0吗?感觉不太对。谢谢大家!
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
松哥统计:1、个人认为作为等级带入可能比较合适;2、如果是等级带入,就不用哑变量了,如果你当做分类,则需要哑变量
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
yufangs 求教大神们,一个分类变量(每月可支配资金,~1000,~2000,……~4000,&4000)(这样的变量是分类吧?还是等级变量?这里有点晕)和一个连续型变量(主观幸福感的得分)怎么做相关呢?假设上面两个变量有关联,我再做回归,回归方程里能全是哑变量吗?如果可以都是哑变量,那参考变量的选择有什么要求或标准吗?回归方程的形式是y=a0+a1 x1+a2 x2+a3 x3+a4 x4 吗?那参考变量怎么表现出来呢?当每月可支配资金&4000时,y=a0吗?感觉不太对。谢谢大家!回归分析对于自变量和因变量并没有什么特殊的要求,甚至没有严格要求数据符合正态分布。如果您想说明,每月可支配资金越高,主观幸福感的变化,可以将“每月可支配资金”最低的等级设为参考变量。如果您想说明每月可支配资金降低,主观幸福感的变化,可以将“每月可支配资金”最高的等级设为参考变量。用易侕统计进行分析不需要设置哑变量,软件自动识别变量类型进行分析。具体如何实现您可以看看这个内容:blob:
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
松哥统计 松哥统计:1、个人认为作为等级带入可能比较合适;2、如果是等级带入,就不用哑变量了,如果你当做分类,则需要哑变量非常感谢
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园spss多元线性回归应变量为连续变量,自变量为二分类变量如何处理,具体操作.结果如何分析
spss多元线性回归应变量为连续变量,自变量为二分类变量如何处理,具体操作.结果如何分析
用SPSS进行多元回归以后,系统会自动给出x1、x2和x3(从大到小)的R的平方和,相减就是解释率.
我有更好的回答:
剩余:2000字
与《spss多元线性回归应变量为连续变量,自变量为二分类变量如何处理,具体操作.结果如何分析》相关的作业问题
相互独立的问题叫“多重共线性” 用vif检验 理论上说就是相关不超过90%都问题不大 肯定会有相关的
照道理是都需要做散点图的,只不过多元线性回归是采用多维散点图来看是否有线性关系
你是否要问这些定类和定序变量怎么进行回归分析,是吧是这样的,在统计中,我们不支持将定类的变量用来作回归分析,可以将定序的变量作回归分析,就是用数字1、2、3等等代替就可以了.而在实际中,有些统计学家也会将定类变量做这样的回归分析,在统计学界中,一般也认同,但不提倡,你应该知道为什么吧,因为这些数据不具备定比变量的特征,
这样是不可以横向比较的,因为每个变量的系数的量纲不一样.如果你想比较自变量对因变量的影响程度的话,首先把所有变量消除量纲再进行回归,回归出来的系数的绝对值大小就表示影响程度的大小.怎么消除量纲自己查资料吧! 再问: 谢谢。不过T2到T7其实分别是几个行业的就业人数,T1是一个总人数,可以看成是一样的量纲吗?另外可以用b
sig的值小于0.05,说明有显著的影响,也就是自变量与因变量间存在显著的线性关系而常数项无论sig值,无论大小i是否显著,在你写回归方程时,都需要写进去的
多元线性回归之前不能做数据标准化处理,否则会出现错误的结果.标准化之后自变量和因变量数列几乎相同或者是相差无几了,所以常数项肯定几乎是0
要看每一个自变量的sig是否小于0.05,只要有一个不满足,则应选择STEPWISE方法,重新计算.
逐步回归只是回归过程采用的其中一种方法而已. 多元线性回归可以和非线性回归相区分,也就是解释变量和被解释变量之间建立的回归方程,如果是线性的,则是线性回归,否则是非线性回归. 多元逐步回归是回归分析建模的一种,举个例子来说,现在有一个因变量A,建模的时候可能的解释变量有5个,分别是B1,B2,B3,B4和B5,但是搞不
你说的是哪个p值呢,ANOVA里的p值要小于0.05,才说明方程有效.后面的系数,B值对应的P小于0.05说明该系数比较有效.
你说的共线性是高度共线还是有点高度共线只能用岭回归啊,主成分回归啊sem啊.很多方法解决啊 再问: VIF=16 再答: 高度共线性了,改方法吧,不能直接回归再问: ???????????????????? ??????
原假设是“X1的系数为0”,sig值低于0.05就可以拒绝原假设啦 再问: 也就是说,原假设是x1的系数为0 ,而不是我自己设置的那个假设吧?我都晕了一下午了。。。如果是我自己设置的假设,那就互相矛盾了 再答: 一句话,这个结果非常好
当然有意义.F值对应的SIG>0.05,则表示回归方程是无效的.
较容易.比如,你想这样二分:4和5一组,1-3一组.点转换--计算新变量,就可以实现.下面有一个if按钮,可以点它,你尝试一下,很快会明白.
使用二分类的logistic回归分析因变量移入相应对话框自变量中的分类变量移入相应的类别对话框,连续性自变量移入协变量对话框 其他默认 就可以了其实操作是很简单的,但是结果解释就比较难
二分类的直接纳入,多分类无序的需要哑变量化
不显著就应该剔除,除非你想硬塞进这个自变量,那你只有改数据了
多元回归分析 你要先确定一下自变量间是否存在严重的共线性,如果没有共线性,然后还要通过散点矩阵看看是否成线性关系,这些之后才可以做多元线性回归所以只看你现在的结果,的确只有x5才有意义,所以你要根据参考资料及常识等进行初步判断,这样的结果是否正确,如果不正确需要重新进行
如果你做的是多元回归 看beta那列数据 绝对值越大影响越大 正负号是影响的方向
你的回归方法是直接进入法拟合优度R方等于0.678,表示自变量可以解释因变量的67.8%变化,说明拟合优度还可以.方差检验表中F值对应的概率P值为0.000,小于显著度0.05,因此应拒绝原假设,说明自变量和因变量之间存在显著的线性关系.参数检验表中只有自变量X2和常数项的概率P值为0.000,小于显著度0.05,而自豆丁微信公众号
君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
分类变量和连续变量的相关性度量
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口spss分类变量与连续变量的相关分析
最近,受一位韩国留学生的委托在指导她做论文的数据分析过程中,遇到这样一个问题,也是她的韩国导师要求的,做“连续变量和分类变量的相关分析”。我实在纳闷了很久,通常在做这种分析时,如果自变量属于分类变量,因变量属于连续性的变量时,做t检验或者方差分析的,以此检验出分类变量不同类别在该连续变量上是否有差异;可是这位导师偏偏要求做相关分析,研究了半天,又查了很多资料,发现结论不一致。也不清楚到底谁的正确,同时在找资料过程中,我也灵机一动,找到一种新的方法(对我来说是新创造的,可能很多spss高手已经用的不想用,也可能是错误的,这里提出来,希望得到批评指正)。
有些人说spss不能做分类与连续性的相关分析,但也有人说能做,就像我碰到的这位导师,于是我按照能做的思路来总结。
由于分类变量涉及到二分类或者是多分类(三类及以上),分情况说明&
如果是二分类,而且是自然的二分类,比如性别(男、女)这种的,在录入编码时,用0、1表示时,据说可以直接采用pearson相关,我试了下,能得出结论,但不知道是否正确;但是我用我想到的办法尝试之后,发现得出的结论跟直接相关分析数据一致。
2.多分类(三类以上)的自变量和连续性因变量的相关。这个大致口径一致,说spss无法操作,但也有人说直接相关就好了,可是直接相关个人感觉是完全错误的,因为分类变量很多分类的编码数字是没有大小意义的,比如春夏秋冬四类,在spss录入时用1234代替,这里的1234根本没有大小好坏之分,那得出的相关系数怎么解释呢?况且这种多分类变量在求相关时,一般是需要得出里面的每个分类与连续性因变量的相关系数的,于是spss似乎没法解决了。
这里提下我的方法,说实话,我并不知道正确与否,希望有专家能够验证一下,并指导一下。
方法很简单:就是设置哑变量。
通常在回归分析时,如果是二分类变量可以直接当做连续性变量进行回归,而多分类时,则需要设置哑变量,即将每个类别转换成0,1的编码来表示,因此这里我们求相关系数时,也可以采用类似的设置哑变量,只不过是有几个类别就设置几个哑变量,这也相当于将多分类变量变成了多个0、1编码的二分类变量,然后再直接使用相关分析,选择所有的哑变量和连续性因变量进行普通的pearson相关,就可以得出每个分类与因变量的相关系数了。
我通过这种方法来计算过二分类变量的相关系数,发现相关系数是一致的,但是多分类的就不知道如何了。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 自变量相关性显著 的文章

 

随机推荐