EDIT: Хорошо, если данные двухмерны следующим образом:
x = [1,1,1,2,2,2,3,3,3,4,4,4,5,5,5]
y = [8,7,5,4,3,7,8,3,2,1,9,11,16,18,19]
Затем, как вычислить k-средство (3 значения) и сделать график?
Невозможно ли выстроить расчетные значения центроида по существующему сюжету на основе данных здесь? Я хочу сделать подобный сюжет, как показано в следующей ссылке
http://glowingpython.blogspot.jp/2012/04/k-means-clustering-with-scipy.html
Однако я не мог понять. Любая помощь будет высоко оценена.
import numpy as np, matplotlib.pyplot as plt
from scipy.cluster.vq import kmeans, vq
data = np.array(np.random.rand(100))
plt.plot(data, 'ob')
centroids, variances= kmeans(data,3,10)
indices, distances= vq(data,centroids)
print (centroids)
[ 0.82847854 0.49085422 0.18256191]
plt.show()