Сопоставление адресов между 2 таблицами / наборами данных
Привет,
У меня есть 2 таблицы / набора данных, и в них есть разные поля, такие как имя,возраст, пол, адрес. Я хочу провести сопоставление по столбцу адреса. Мне нужна программа, которая извлекает только совпадающие адреса между двумя таблицами. Проблема здесь в том, что один и тот же адрес может быть введен несколькими способами
например
Таблица 1 Содержит
Мэри-Стрит, 114
Таблица 2 Содержит
114 Мэри-Стрит
114 Мэри Сент.
Приведенные выше примеры записей одинаковы, но они будут считаться разными при сопоставлении с помощью запроса. Это требует некоторого алгоритма, так как один и тот же адрес может быть записан 1000 различными способами, и один и тот же адрес также может содержать опечатки.
Я много искал возможное решение, многие рекомендовали алгоритм нечеткого поиска, но я не уверен, с чего и как начать.
Я ищу идеи для эффективного алгоритма. Любая идея может быть псевдокодом или на вашем предпочтительном языке.
Любая помощь будет высоко оценена.
Спасибо
Что я уже пробовал:
Я искал по этому поводу в разных местах, но все равно не повезло, многие рекомендовали нечеткий алгоритм поиска, я не знаю, с чего и как начать.
Данные доступны в 2 таблицах, и в них много записей, поэтому будет очень полезно, если я смогу получить программу, которая принесет мне похожие или приблизительно одинаковые записи.
Спасибо.
Daniel Jones
посмотри на этой ссылке, надеюсь: https://documentation.play-sql.com/display/SQL/Matching+записи+с+двумя+столов+-+то+регистрация