Я хотел бы выполнить некоторые основные операции на столбце Spark Dataframe, заменив подстроки. Какой самый быстрый способ сделать это?
В моем текущем случае использования у меня есть список адресов, которые я хочу нормализовать. Например, этот фреймворк данных:
id address
1 2 foo lane
2 10 bar lane
3 24 pants ln
Станет
id address
1 2 foo ln
2 10 bar ln
3 24 pants ln