У меня есть DataFrame
загруженный из файла .tsv
. Я хотел создать несколько поисковых участков. Проблема заключается в том, что набор данных большой (~ 1 миллион строк), поэтому на графике слишком много точек, чтобы увидеть тренд. Плюс, это занимает некоторое время, чтобы построить.
Я хотел сделать выборку 10000 случайно распределенных строк. Это должно быть воспроизводимо, чтобы одна и та же последовательность случайных чисел генерировалась в каждом прогоне.
Это: Пример двух выборок данных для панд одинаковым образом, кажется, на правильном пути, но я не могу гарантировать размер подвыборки.