Из документов PySpark rangeBetween
:
rangeBetween(start, end)
Определяет границы фрейма от начала (включительно) до конца (включительно).
Начало и конец относительны от текущей строки. Например, "0" означает "текущая строка", в то время как "-1" означает одно отключение перед текущей строкой, а "5" означает пять отключений после текущей строки.
Parameters:
- начало - граничное начало, включительно. Кадр не ограничен, если это -sys.maxsize (или ниже).
- конец - конец границы включительно. Фрейм не ограничен, если это sys.maxsize (или выше). Новое в версии 1.4.
в то время как rowsBetween
rowsBetween(start, end)
Определяет границы фрейма от начала (включительно) до конца (включительно).
И начало, и конец являются относительными позициями из текущей строки. Например, "0" означает "текущая строка", а "-1" означает строку перед текущей строкой, а "5" означает пятую строку после текущей строки.
Parameters:
- начало - граничное начало, включительно. Кадр не ограничен, если это -sys.maxsize (или ниже).
- конец - конец границы включительно. Фрейм не ограничен, если это sys.maxsize (или выше). Новое в версии 1.4.
Например, для rangeBetween
чем "1 выключен" отличается от "1 строки"?