SPSSAU想对样本大数据的定义进行修改编辑

当前SPSSAU提供对标题修改编辑删除,对數据文档修改名称备份,下载删除等但不提供直接对原始数据编辑,建议对原始数据处理后再上传到SPSSAU即可。如果需要进行异常值处理等可使用SPSSAU【数据编码-异常值/无效样本】功能。

在数据分析之前首先需要进行數据查看,包括数据中是否有异常值无效样本等。无效样本会干扰分析研究扭曲数据结论等,因而在分析前先对无效样本进行标识显礻尤其必要如果有无效样本则需要先进行处理,然后再进行分析另外如果数据中有异常值也需要进行处理后再进行分析。


无效样本设置时共两种设置标准:相同数字和缺失比例

  • 相同数字:当选中标题中有(比如70%)均是同一数字时标识为无效样本;此处70%并没有固定標准,人为设定
  • 缺失比例:当选中标题中有(比如70%)均是缺失数据时,标识为无效样本;此处70%并没有固定标准人为设定。

无效样本的使用注意事项:

  • 问卷中如果一个样本同时有很多相同的数字或者很多不填空的缺失数据。此时说明该样本是无效的可使用无效样本功能,一般以70%作为标准即可
  • 无效样本设置时,需要先选中需要处理的标题如果是整份数据,则使用shift/ctrl批量选中全部标题即可
  • 无效样本设置後可对“标识新标题”进行频数分析,了解无效样本数量等

异常值可能会影响分析结果,可以先用箱盒图看一下数据的总体分布再來决定是否处理异常值,影响严重的就剔除不严重的就留下。

如果研究目的完全在于信息浓缩并且找出主成分与分析项对应关系,此時直接使用因子分析更优实际研究中,主成分目的更多在于权重计算和综合得分计算(当然这两项功能在因子分析中也有)

如果维度與分析项对应情况没有得到改善,可以参考:

我要回帖

更多关于 大数据的定义 的文章

 

随机推荐