Ahmed AE Ответов: 0

Как создать новые записи для импортированных записей из разных файлов дампа, которые имеют повторяющийся идентификатор, но разные данные?


I have 3 dump files from 3 different machines pc1, pc2 and pc3. I am trying to sync the data from the 3 dump files with the database on my server but, unfortunately the dump files have similar unique ids for different records, because they are on different machines. When merging, the data from the dump file, overwrites the data on my server(if they have the same unique id). Is there a way for creating new records for the records that has the same unique id but different data fields. If no if there are other 3rd party tools for that?

What I have tried:

I have found a similar question but it gave one of 2 solutions:

    1. Either to replace the repeated rows

    2. Or to skip the repeated records

And no one of the above is suitable for me. I need to create a new record for the repeated rows with repeated unique ids but different other data field values
</pre>

Richard MacCutchan

Создайте новый уникальный идентификатор для каждой записи по мере их чтения.

Ahmed AE

Что делать, если есть одна и та же запись в 2 файлах дампа, но имеют разные идентификаторы.

Richard MacCutchan

Ну, вам придется найти какой-то метод их идентификации и исключения дубликата. Похоже, что сначала вам нужно объединить три файла дампа и удалить все дубликаты записей. Затем вы можете обработать оставшуюся часть, изменив идентификатор каждой записи на новый уникальный идентификатор, который не конфликтует с вашими существующими данными.

Ahmed AE

проблема, которая находится между файлами дампа и друг другом,также может быть найдена между результирующим файлом дампа (после слияния) и базой данных на моем сервере, я имею в виду, что могут быть записи, которые находятся в результирующем файле дампа, а также находятся в базе данных на моем сервере, так что же я могу сделать в этом случае?

Richard MacCutchan

Затем следуйте приведенному выше предложению.

Ahmed AE

"Создайте новый уникальный идентификатор для каждой записи, когда вы их читаете". решит ли это проблему ? это позволит только избежать перезаписи уже найденных идентификаторов, но не решит проблему повторения записей в базе данных сервера

Richard MacCutchan

Попробуйте подумать о том, что вы пытаетесь сделать здесь. Если у вас есть потенциальные дубликаты записей, вам нужно найти способ их отбросить. Независимо от того, находятся ли они в файлах дампа или в базе данных, проблема точно такая же.
Обрабатывайте каждый дамп-файл по одному за раз.
Если следующая запись является дубликатом базы данных, то отбросьте ее.
Если нет, то создайте уникальный идентификатор и введите его в базу данных.
Повторите процедуру для всех записей, а затем для других файлов дампа.

Ahmed AE

спасибо

0 Ответов