Я просмотрел склеарные стратифицированные документы для выборки, а также pandas docs, а также Стратифицированные образцы из Pandas и sclearn стратифицированная выборка на основе столбца, но они не решают эту проблему.
Im ищет быстрый способ pandas/sklearn/numpy для создания стратифицированных образцов размера n из набора данных. Однако для строк с меньшим, чем указанный номер выборки, он должен принимать все записи.
Конкретный пример:
Спасибо!:)