打开我们要分析的数据,单击“分析”,选择“回归”,然后选择“⼆元Logistics回归”,弹出下⾯的界⾯,如图:
把是否购买移到因变量框⾥⾯去,把消费⾦额和消费数量移动到协变量框⾥⾯去,然后单击“保存”按钮,弹出“Logistics回归:保存”界⾯,选择“预测值”下⾯的“概率”,之后咋爱单击浏览按钮,把模型保存到你想保存的位⼦,完成之后单击“继续”,回到刚刚的那个界⾯之后单击“确定”按钮,就进⾏了“Logistics回归分析”了。
它会在你原始的数据表格⾥⾯新增加⼀列数据,这个就是那个事件发⽣的概率值,在⼆元Logistics回归⾥⾯,结果是⽤概率值来表⽰的,但是在0到0.5表⽰的就是不发⽣;0.5到1表⽰的就是发⽣。
⼆元Logistics回归分析结果最重要的就是下⾯那张表格:⽅程式中的变量
表格⾥⾯的第⼆列就是回归⽅程的系数,写成回归⽅程就是:
logit(P) = 0.01*消费⾦额+(-2.725)*消费数量
怎么做数据分析“常量”因为显著性为0.881⼤于0.05,所以可以说影响⼒⼩,可以忽略,加进去也可以(那个常量我问下别⼈,都说可以忽略,但是不敢确定,怕万⼀就加进去试⼀下,对⽐下结果)。
接下来就是⽤已经建⽴好的模型来做预测
打开你要预测的数据,然后单击“实⽤程序”,选择“评分向导”,浏览你刚刚保存模型的地址,有⼏个要注意的地⽅,直接看图:
接下来直接就是下⼀步下⼀步就可以了,然后单完成,它会在你要预测的数据表⾥⾯新增加⼀列数据,也就是预测结果。
这样我们的⼆元Logistics回归预测也就结束了。
注意:
1、在这⾥我只是进⾏了简单的⼆元Logistics回归分析,也就是说因变量只有两个:是和否,发⽣或者不发⽣,其实还有因变脸多种情况的,⽐如:⾼、低和中三种情况的。
2、还有就是在这⾥也没有进⾏变量的处理,如果你的数据有很多的变量你肯定是要先进⾏降维的,我这⾥只是根据我
之前的⼀些数据进⾏的分析,没有具体做那些预备⼯作的。
发布评论