Доступны многие алгоритмы кластеризации. Популярным алгоритмом является K-средство, где на основе заданного количества кластеров алгоритм выполняет поиск наилучших кластеров для объектов.
Какой метод вы используете для определения количества кластеров в данных в кластеризации k-значений?
Доступен ли какой-либо пакет в R с помощью метода V-fold cross-validation
для определения правильного количества кластеров?
Другим хорошо используемым подходом является алгоритм максимизации ожиданий (EM), который присваивает распределение вероятности каждому экземпляру, что указывает на вероятность его принадлежности к каждому из кластеров.
Этот алгоритм реализован в R?
Если это так, имеет ли он возможность автоматически выбирать оптимальное количество кластеров путем перекрестной проверки?
Вы предпочитаете какой-то другой метод кластеризации?