Я знаю, что такое k-средство, и я также понимаю, что такое алгоритм k-mean ++. Я считаю, что единственное изменение - это то, как найдены исходные K-центры.
В версии ++ мы изначально выбираем центр и используя распределение вероятности, мы выбираем остальные k-1-центры.
В алгоритме MLLib для k-означает, что является параметром initializationSteps
?