在数据分析之前首先需要进行數据查看,包括数据中是否有异常值无效样本等。无效样本会干扰分析研究扭曲数据结论等,因而在分析前先对无效样本进行标识显礻尤其必要如果有无效样本则需要先进行处理,然后再进行分析另外如果数据中有异常值也需要进行处理后再进行分析。
无效样本设置时共两种设置标准:相同数字和缺失比例。
无效样本的使用注意事项:
异常值可能会影响分析结果,可以先用箱盒图看一下数据的总体分布再來决定是否处理异常值,影响严重的就剔除不严重的就留下。
如果研究目的完全在于信息浓缩并且找出主成分与分析项对应关系,此時直接使用因子分析更优实际研究中,主成分目的更多在于权重计算和综合得分计算(当然这两项功能在因子分析中也有)
如果维度與分析项对应情况没有得到改善,可以参考: