У меня есть набор данных объемом 2,5 Гбайт, что довольно велико для моей памяти 4 ГБ. Интересно, будет ли преобразование символьных переменных в факторы экономии пространства и времени обработки.
Я бы предположил, что внутренне факторы будут храниться в числовом виде с помощью таблицы поиска для уровней. Но я не уверен, как это работает.