问:
对数据进行预处理时,如果要做归一化处理,是先进行归一化处理,再划分数据集吗?
答:
先进行训练集和测试集的拆分, 然后才能进行归一化,原因是因为测试集是为了评估模型的在未知数据中的表现情况, 归一化的过程, 也是我们建模中的一步, 如果说将测试集也放到归一化模型的训练过程当中, 那么就等于说我们的模型接触到了测试集的信息,这种情况称为数据泄露, 在建模过程当中是不允许的.
因为是先print(),再移除的2,每次remove一个元素,列表就会自动向前收缩,这就导致循环跳过了相邻的后面一个元素移除一个元素,后面的元素就会往前去一位