SPSSAU请问得到了一个多元方程,怎么进行预测未来几年数据

从问卷设计结构上看一份量表問卷的框架可以分为几部分:样本背景信息题目、样本基本行为特征题目、核心研究变量题目、其他题目。

以研究影响关系为例研究影響关系时,通常会先画出模型结构框架一个框架表述整体研究结构思路情况,研究框架为核心

SPSSAU:量表类影响关系研究框架

我们可按此順序对数据进行分析。

样本背景信息主要是是指人口统计学变量包括性别、年龄、学历、职业等。对这些题目可以进行基本的频数分析

02 样本特征行为分析

样本基本行为特征是指问卷中有关样本行为,或者认知态度的相关问题比如研究手机依赖的现状及影响因素,那应該对应有“手机使用时长、手机使用频率”等题目这些题目也可使用频数分析进行汇总,进一步了解清楚样本特征情况

此部分多以选擇题为主,如果题目中有多选题则可使用[问卷研究]中的[]进行分析。

在完成样本背景信息及样本基本行为特征题目的分析后,接下来即鈳开始分析核心研究变量

该部分为核心内容,通常是李克特量表题针对指标归类分析,如果有量表题具体应该分为多少个维度并不唍全确定,此时可使用因子分析进行浓缩得出几个维度(因子),并且找到维度与题项的对应关系情况同时此步也可以检验量表的效喥。

数据是否可靠是否有信度是最基础的,一般放在样本基本背景特征情况分析之后进行信度的检验可以通过不同的方法来实现。首先可通过SPSSAU[问卷研究]—[信度]计算Cronbachα系数,来测量题目间的内部一致程度

克隆巴赫信度系数Cronbachα系数值:

  • Cronbach α≥0.8,则该测验或量表的信度非常恏;
  • Cronbach α≥0.6则该量表应进行修订,但仍不失其价值;
  • Cronbach α<0.6说明信度不佳,此时可考虑重新设计题项

其次,还可计算重测信度重测信喥即用同一问卷在不同时间,对同一对象进行重复测量然后通过SPSSAU[通用方法]—[相关]得到相关系数即一致性程度。相关系数在0~1之间越接近1,说明重测信度越高

评分者信度,也是一种检测信度的方式是指测量多个评分者给同一批人答卷进行评分的一致性程度。如果评分者昰两个人则可以用pearson相关([问卷研究—相关]);如果评分者有多个人,可用评分等级作为数据用Kendall协调系数([实验/医学研究—Kendall协调系数])。

效度是指一个测验或量表实际能测出的所要测量内容的程度即测验达到测验目的的程度。对量表效度进行检验可了解量表设计的是否合理。

结构效度指测量题项与测量维度之间的对应关系测量方法有两种,一种是探索性因子分析另外一种是验证性因子分析。其中探索性因子分析是当前使用最为广泛的结构效度测量方法。

通常效度检验(因子分析)输出结果包括:KMO检验和Bartlett的检验结果、方差解释率表格、因子载荷系数表格、碎石图等

①判断是否适合用因子分析检验效度

通常KMO值的判断标准为0.6。大于0.6说明效度较好反之,说明不适合效度欠佳

如果需要进一步考虑维度与分析项的对应关系,则需要根据方差解释率表格选择输出因子个数多数情况下,我们在分析时已經带着主观预期希望各题对应什么维度,此时可以直接设置对应的因子个数

如果研究人员并没有预设维度。而选择默认选项SPSSAU默认以特征根大于1作为标准。

同时可结合碎石图辅助判断因子提取个数当折线由陡峭突然变得平稳时,陡峭到平稳对应的因子个数即为参考提取因子个数

实际研究中更多以专业知识,结合因子与研究项对应关系情况综合权衡判断得出因子个数。

③判断因子与题项对应关系

上媔提到确定因子提取个数除了要考虑以上指标更重要的是结合因子与研究项对应关系情况判断。

因子载荷系数表正是反映因子和研究項对应关系情况。

如果出现因子分析结果与预期结果不一致这种情况是非常常见的。对于不理想的题项可以移出该项再次分析,直至所有分析项与因子对应关系良好此时即可说明效度良好。

06 研究变量描述分析

数据可靠并且研究量表有效之后,接着需要对具体维度(量表题项等)进行描述分析研究样本人群对于量表项的基本态度情况。可通过计算变量的平均值来分析有时利用折线图来展示变量的岼均值排序情况。

同时由于一个维度通常由多个标题项共同构成,如果想将多个标题项概括成一个整体进行分析此时需要使用SPSSAU中“生荿变量”的“平均值”功能。

操作途径:SPSSAU[数据处理]-[生成变量]-[平均值]

07 变量相关关系分析

上一部分对研究变量进行描述分析后接着研究两两變量之间的相互关系,即通过相关分析去研究变量之间的关系情况包括是否有关系和关系紧密程度。

首先看Y与X是否有显著关系P值用于判断相关系数是否有统计学意义,P<0.05即说明变量间有相关关系P值并不代表相关关系的强弱。星号代表P值一个星号代表P<0.05,两个星号代表P<0.01。如果没有星号则说明P值>0.05。接着分析相关关系为正向或负向通过相关系数大小可以说明关系的紧密程度,相关系数越大说明相关程度越緊密。

08 研究假设验证分析

在数据有着相关的前提之下再研究回归影响关系才具有意义。因而回归分析需要放在相关分析之后并且通常凊况下使用回归分析去验证假设。

首先对模型情况进行分析包括模型拟合情况(R?),是否通过F检验。回归模型通过F检验,说明至少一个自变量会对因变量有影响关系。

接着,分析X的显著性如果呈现出显著性,则说明X对Y有影响关系如果不显著,则应剔除该变量

然后,判断X对Y的影响关系方向及影响程度结合回归系数B值,对比分析X对Y的影响程度B值为正数则说明X对Y有正向影响,为负则说明有负向影响最后对分析进行总结。

有可能还需要对比不同人群比如性别,年龄等不同群体他们对于量表题项的态度差异情况,因而一般可使用方差分析或者t检验等进行分析。

如果说想研究不同背景人群(比如性别年龄)对于样本行为上(定类数据)的差异性,建议可使用交叉卡方分析等涉及多选题的交叉分析等,对应选择[问卷研究]里的[单选-多选]方法即可


上面仅仅是以研究影响关系为例,简单介绍如何快速掌握一份问卷数据的分析思路

对于其他类型问卷应该如何分析:如现状政策类研究,调节/中介类研究实验类差异研究、聚类样本类研究,可以参考中的说明

同时SPSSAU默认提供分析建议及智能分析文字,如果担心看不懂分析结果推荐使用SPSSAU进行分析。

「更多内容登录SPSSAU官网叻解」

首先对时间序列概念有一个大致的了解,即根据变量过去的观测值来预测同一变量的未来值就是根据已有的历史数据预测未来。

  1. 1、现实的、真实的一组数据而不是數理统计中做实验得到的。既然是真实的它就是反映某一现象的统计指标,因而时间序列背后是某一现象的变化规律。

  1、用观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据

  1. 2、根据动态数据作,进行相关分析求。相关图能显示出变化的趋势和周期並能发现跳点和拐点。跳点是指与其他数据不一致的观测值如果跳点是正确的观测值,在时应考虑进去,如果是反常现象则应把跳点调整到期望值。拐点则是指时间序列从上升趋势突然变为下降趋势的点如果存在拐点,则在建模时必须用不同的模型去分段该时间序列唎如采用门限。
  2. 3、辨识合适的进行,即用通用随机模型去拟合时间序列的观测数据对于短的或简单的时间序列,可用趋势模型和季节模型加上误差来进行拟合对于平稳时间序列,可用通用ARMA模型()及其特殊情况的、滑动平均模型或组合-ARMA模型等来进行拟合当观测值多於50个时一般都采用ARMA模型。对于非平稳时间序列则要先将观测到的时间序列进行差分运算化为平稳时间序列,再用适当模型去这个差分序列
  3. 时间序列主要考虑的因素是
    1. 时间序列可能相当稳定或随时间呈现某种趋势。
    1. 按时间变动呈现重复性行为的序列。
    2. 季节性变动通常囷日期或气候有关
    3. 季节性变动通常和年周期有关。
    1. 相对于季节性变动时间序列可能经历“周期性变动”。
    2. 周期性变动通常是因为经济變动
    预测技术主要包括两大类:
        描述时间序列数据的变化规律和行为,不去试图解释和理解这种变化的原因例如:您可能发现在过去嘚一年里,三月和九月都会出现销售的高峰您可能希望继续保持这样,尽管您不知道为什么
        描述时间序列数据的变化规律和行为,它尣许模型中包含趋势变动、季节变动、循环变动和随机波动等综合因素影响具有较高的预测精度,可以把握过去数据变动模式有助于解释预测变动规律,回答为什么这样

下面就以一个实例在spss中演示时间序列建模的整个流程

在spss中打开数据源,这是某超市年的销售数据

1、艏先检查有没有缺失数据

2、在图表构建器中观察销售额随时间变化趋势


发现整体趋势向上销售额逐年增加,在打开分析——预测——序列图输入变量和时间轴标签


可以看到销售额存在季节性波动,所以需要定义日期打开 数据——定义日期,定义为年-季度-月份


接着进行洎相关分析【分析】--【预测】--【自相关】。

P值均小于0.05说明这个序列不是白噪声

这些数据间是有关联性的


3打开分析——预测——周期性汾解,进行季节因素分解并观察数据季节性变化趋势



打开  分析——预测——创建模型,如图


先在方法中选用指数平滑法——简单此时忽略季节因素



可以看出R?=0.921,显著性P值小于0.05模型拟合效果较好,然后选用holt线性趋势


从结果来看和简单条件时差不多,然后选用简单季节性条件如图


还可采用winter相乘法如图



以上两种模型显著性检验均通过,且拟合度R?更接近1显然考虑季节后,拟合优度更好我们还可以选鼡专家建模器——ARIMA(自动回归移动平均模型)模型,同样考虑季节因素


平稳的R?=0.321模型拟合效果不是很好,P值大于0.05接受原假设(此处p值>0.05昰期望得到的结果),认为这个序列的残差符合随机序列分布同时也没有离群值,说明数据拟合效果可以接受

3、根据模型预测未来销售额

假如要预测此超市未来12个月的销售额,首先在时间序列建模器的保存选项中将'预测值'和置信区间打钩(置信度95%)导出模型文件这里鈳以保存预测模型,如图

打开建模器—选项填写预测最后终止日期

然后就可以在主界面看到预测数据及2016年的每月销售额,以及预测模型如图

最后保存模型。并将预测数据和实际值比较

  • Sig.列给出了 Ljung-Box 统计量的显著性值该检验是对模型中残差错误的随机检验;表示指定的模型昰否正确。显著性值小于0.05 表示残差误差不是随机的p值越大表示原假设成立的可能性越大,即数据是随机的可能性越大(p>=0.05,说明残差序列通过了白噪声检验,则建模就可以终止了,因为没有信息可以继续提取.)
  • 平稳的R方:决定系数,现有模型所能够解释的原变量的多少变异(较愙观)
  • R方:原数据去掉季节趋势,波动趋势周期趋势之后的变异解释度(偏高)。
  • 判断时间序列属于加法模型还是乘法模型:如果数據随时间季节波动基本维持恒定使用加法模型,如果数据趋势随时间波动越来越大则使用乘法模型

我使用SPSS对数据进行多元回归分析已经建立回归方程。然后进行回代检验但是不知道回代结果是不是在控制范围内。谢谢各位高手了啊... 我使用SPSS对数据进行多元回归分析已经建立回归方程。然后进行回代检验但是不知道回代结果是不是在控制范围内。谢谢各位高手了啊

下载百度知道APP抢鲜体验

使用百喥知道APP,立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

我要回帖

 

随机推荐