Каковы рекомендуемые методы для извлечения мест из свободного текста?
То, что я могу придумать, - это использовать правила регулярных выражений, такие как "слова... в местоположении". Но есть ли лучшие подходы, чем это?
Также я могу подумать о том, что таблица таблиц поиска с именами для стран и городов, а затем сравните каждый извлеченный токен от текста с хэш-таблицей.
Кто-нибудь знает о лучших подходах?
Изменить: я пытаюсь извлечь места из текста твитов. Таким образом, проблема большого количества твитов также может повлиять на мой выбор метода.