У меня есть большой набор данных со 100 переменными и 3000 наблюдений. Я хочу обнаружить те переменные (столбцы), которые сильно коррелированы или избыточны и поэтому удаляют размерность в кадре данных. Я пробовал это, но он вычисляет только корреляцию между одним столбцом и другими; и я всегда получаю сообщение об ошибке
for(i in 1:ncol(predicteurs)){
correlations <- cor(predicteurs[,i],predicteurs[,2])
names(correlations[which.max(abs(correlations))])
}
Warning messages:
1: In cor(predicteurs[, i], predicteurs[, 2]) :
the standard deviation is zero
2: In cor(predicteurs[, i], predicteurs[, 2]) :
the standard deviation is zero
Кто-нибудь может мне помочь?