Корреляция взвешенных данных между различными источниками данных
Всем привет,
Мне было интересно, есть ли какое-либо доступное программное обеспечение с открытым исходным кодом, которое помогает коррелировать данные на основе заданных значений с весами.
Я работаю над проектом, в котором у нас есть много различных источников данных, которые иногда могут быть неверными из-за канцелярских ошибок. Чтобы соотнести данные, мы свяжем веса с определенными полями, которые вычислят, насколько вероятно, что эти данные связаны друг с другом. Данные будут учитывать разницу между данными и видеть, насколько вероятно, что это была канцелярская ошибка, а не фактический другой источник.
Что я уже пробовал:
Если бы этого не было, я был бы заинтересован в создании решения с открытым исходным кодом, которое может выполнить эту задачу. Я просто не хотел заново изобретать колесо, если оно уже существовало.
Спасибо
P. S Если кто-то чувствует, что они, возможно, видели этот вопрос раньше, я написал на SO вчера, но я получил только downvotes и никаких комментариев, так что если я нарушаю какой-то этикет форума, не стесняйтесь сообщить мне об этом.