Я долго искал ответ на этот вопрос, поэтому я надеюсь, что кто-то может мне помочь. Я использую dbscan из библиотеки fpc в R. Например, я рассматриваю набор данных USArrests и использую dbscan на нем следующим образом:
library(fpc)
ds <- dbscan(USArrests,eps=20)
Выбор eps был просто проб и ошибок в этом случае. Однако мне интересно, есть ли функция или код для автоматизации выбора лучших eps/minpts. Я знаю, что некоторые книги рекомендуют производить сюжет k-го сортированного расстояния до ближайшего соседа. То есть ось x представляет "Точки, отсортированные по расстоянию до k-го ближайшего соседа", а ось y представляет "k-е расстояние до ближайшего соседа".
Этот тип графика полезен для того, чтобы помочь выбрать подходящее значение для eps и minpt. Надеюсь, я предоставил достаточно информации для того, чтобы кто-то помог мне. Я хотел опубликовать фотографию того, что я имел в виду, но я все еще новичок, поэтому пока не могу опубликовать изображение.