Что такое параметр initializationSteps в Kmeans ++ в Spark MLLib?

Я знаю, что такое k-средство, и я также понимаю, что такое алгоритм k-mean ++. Я считаю, что единственное изменение - это то, как найдены исходные K-центры.

В версии ++ мы изначально выбираем центр и используя распределение вероятности, мы выбираем остальные k-1-центры.

В алгоритме MLLib для k-означает, что является параметром initializationSteps?

Ответ 1

Чтобы быть точным, k-mean ++ является алгоритмом выбора начальных центров и не описывает весь процесс обучения.

MLLib k-means использует k-means || для инициализации, которая является распределенным вариантом ++. Он отображает не одну, а несколько точек для количества итераций.

initializationSteps соответствует числу итераций, и согласно исходная бумага должна быть примерно O (log n).