Я работаю над проектом python, где изучаю эволюцию структуры РНК (представленную как строка, например: "(((...)))", где скобки представляют собой базовые пары). Суть в том, что у меня есть идеальная структура и население, которое эволюционирует к идеальной структуре. Я реализовал все, но хотел бы добавить функцию, в которой я могу получить "количество ведер", т.е. K наиболее представительных структур в совокупности в каждом поколении.
Я думал об использовании алгоритма k-mean, но я не уверен, как его использовать со строками. Я нашел scipy.cluster.vq, но я не знаю, как использовать его в моем случае.
спасибо!