fdaniels110 Ответов: 1

Корреляция взвешенных данных между различными источниками данных


Всем привет,

Мне было интересно, есть ли какое-либо доступное программное обеспечение с открытым исходным кодом, которое помогает коррелировать данные на основе заданных значений с весами.

Я работаю над проектом, в котором у нас есть много различных источников данных, которые иногда могут быть неверными из-за канцелярских ошибок. Чтобы соотнести данные, мы свяжем веса с определенными полями, которые вычислят, насколько вероятно, что эти данные связаны друг с другом. Данные будут учитывать разницу между данными и видеть, насколько вероятно, что это была канцелярская ошибка, а не фактический другой источник.

Что я уже пробовал:

Если бы этого не было, я был бы заинтересован в создании решения с открытым исходным кодом, которое может выполнить эту задачу. Я просто не хотел заново изобретать колесо, если оно уже существовало.

Спасибо

P. S Если кто-то чувствует, что они, возможно, видели этот вопрос раньше, я написал на SO вчера, но я получил только downvotes и никаких комментариев, так что если я нарушаю какой-то этикет форума, не стесняйтесь сообщить мне об этом.

1 Ответов

Рейтинг:
6

CPallini

Я думаю, вы могли бы поискать C# статистическая библиотека, см., например c# - что такое хороший статистический математический пакет для .Net? - переполнение стека[^].
Вы также можете выбрать использование статистически ориентированного языка программирования, например Р[^].
Наконец, если вам нравятся сценарии, то вы можете найти множество статистических библиотек, доступных для Python.


Цитата:
P. S Если кто-то чувствует, что они, возможно, видели этот вопрос раньше, я написал на SO вчера, но я получил только downvotes и никаких комментариев, так что
Лично я считаю, что это их вина, а не ваша.


fdaniels110

Наш технический стек не включает Python или R прямо сейчас, но я мог бы попытаться защитить python, поскольку я уже использую его для передачи данных и манипулирования ими.

Спасибо!