У меня есть DataFrame загруженный из файла .tsv. Я хотел создать несколько поисковых участков. Проблема заключается в том, что набор данных большой (~ 1 миллион строк), поэтому на графике слишком много точек, чтобы увидеть тренд. Плюс, это занимает некоторое время, чтобы построить.
Я хотел сделать выборку 10000 случайно распределенных строк. Это должно быть воспроизводимо, чтобы одна и та же последовательность случайных чисел генерировалась в каждом прогоне.
Это: Пример двух выборок данных для панд одинаковым образом, кажется, на правильном пути, но я не могу гарантировать размер подвыборки.
