Мне нужно предварительно обработать твиты с помощью Python. Теперь мне интересно, что будет регулярным выражением, чтобы удалить все хэштеги, @user и ссылки твита соответственно?
например,
-
original tweet: @peter I really love that shirt at #Macy. http://bet.ly//WjdiW4
- обработанное твит:
I really love that shirt at Macy
- обработанное твит:
- оригинальное твит:
@shawn Titanic tragedy could have been prevented Economic Times: Telegraph.co.ukTitanic tragedy could have been preve... http://bet.ly/tuN2wx
- обработанное твит:
Titanic tragedy could have been prevented Economic Times Telegraph co ukTitanic tragedy could have been preve
- обработанное твит:
- оригинальное твит:
I am at Starbucks http://4sh.com/samqUI (7419 3rd ave, at 75th, Brooklyn)
- обработанное твит:
I am at Starbucks 7419 3rd ave at 75th Brooklyn
- обработанное твит:
Мне просто нужны содержательные слова в каждом Tweet. Мне не нужно имя пользователя или любые ссылки или любые пунктуации.