Например, я бы хотел классифицировать DataFrame
людей по следующим 4 ячейкам в зависимости от возраста.
age_bins = [0, 6, 18, 60, np.Inf]
age_labels = ['infant', 'minor', 'adult', 'senior']
Я бы использовал pandas.cut()
, чтобы сделать это в pandas
. Как мне сделать это в PySpark
?