Здесь интересная проблема.
У меня есть база данных оракула с информацией о имени и адресе, которая должна сохраняться в актуальном состоянии.
Мы получаем фиды данных из ряда различных источников gov't и должны находить совпадения, а также обновлять ли db данными или создавать новую запись.
Нет никакого уникального идентификатора, который может использоваться для связывания записей вместе, а качество данных не всегда так хорошо - всегда будут опечатки, люди, использующие разные имена (например, Джо против Джозефа), и т.д.
Мне было бы интересно услышать от всех, кто работал над этим типом проблемы, прежде чем они решат это или, по крайней мере, автоматизированные части.