При выполнении регрессии или классификации, каков правильный (или лучший) способ предварительной обработки данных?
- Нормализовать данные → PCA → обучение
- PCA → нормализовать выход PCA → обучение
- Нормализовать данные → PCA → нормализовать выход PCA → обучение
Какое из перечисленных выше правильнее, или это "стандартизированный" способ предварительной обработки данных? Под "нормализацией" я подразумеваю стандартизацию, линейное масштабирование или некоторые другие методы.