Я читаю о различии между кластерами k-средних и k-медоидной кластеризацией.
Предположительно, существует преимущество использования парной меры расстояния в k-медоидном алгоритме вместо более знакомой суммы квадратичной евклидовой метрики расстояния, чтобы оценить дисперсию, которую мы находим с помощью k-средних. И, по-видимому, эта разная метрика расстояния уменьшает шум и выбросы.
Я видел это утверждение, но я еще не видел никаких хороших рассуждений относительно математики, стоящей за этим утверждением.
Что делает парную меру расстояния, обычно используемую в k-medoid лучше? Более точно, как отсутствие квадратного члена позволяет k-медоидам обладать желательными свойствами, связанными с концепцией взятия медианы?