1.主成分分析绝对不能用在实验室中,因为数据量太少,偶尔会用在问卷分析中,但也不常用;
2.因子分析可用于因子效度分析,但并不常用;
3.有几个变量就有几个主成分;
4.接受条件:变量个数/最终降成的维度 >3,最终所选的主成分总比例>70%;
5.主成分的每一个特征向量是构成主成分的每一个变量的系数,表示了各变量对不同主成分的影响程度大小;
6.主成分不能对重要的变量进行压缩;
7.主成分回归模型只能用于数据库;
8.filename1='%s%s' %(path2,pathfile),%表示调用第一个s是path2,第二个s是pathfile;
9.对中处理:减均值, 常用于共线性缓解、ANN、SVM;
10.稳健变换用于Y,当Y是连续的且严重偏态,规范化处理方法:减去中位数再除以四分位距;