Получить 10 средних значений из массива? Существует ли это вообще?
Пожалуйста, простите меня, потому что я честно не знаю, что я спрошу или что именно мне повезло, я думаю, что просто застрял в математической дилемме, но здесь все равно идет...
У меня есть большой набор чисел, то есть 50k или 100k чисел (десятичных), хранящихся в массиве
Они не различаются между собой, они могут или не могут повторяться, нет никаких ограничений.
Поскольку они представляют собой большой набор, мне нужно суммировать их, что-то вроде того, что делает среднее, но со средним я могу получить только 1 среднее из всего массива, и мне нужно получить 10 или 20 средних, или, другими словами, наиболее 10 значимых средних между всем набором чисел.
Есть ли такая операция, которую можно сделать, и если да, то как она называется, чтобы я мог искать дополнительную информацию?
Конечно мне нужно было бы иметь возможность подсчитать количество попаданий каждого среднего или суммарного числа
---
Чтобы придать этому немного больше смысла и контекста, я пытаюсь суммировать журнал данных из автомобиля, каждый "кадр" или "запись" поставляется со значением оборотов в минуту , которое, конечно, варьируется от 0 до 8000, я получаю тысячи этих записей, и мне нужно представить их в таблице оборотов и количество попаданий, полученных каждым "фиксированным" индексом.
В практическом примере предположим, что мы получили следующие значения для обработки
{10,50,90,50,10,400,450,300,550,900,950,1100,1200,1000,900}
оборотах | просмотров
-----|---------
100 | 5 Просмотров
500 | 4 просмотров
1000 | 6 просмотров
В этом примере я как бы сгруппировал похожие числа для простоты, я действительно знаю, как вычислить хиты и выяснить, к какому "индексу" должно идти каждое значение, но сначала мне нужно выяснить, какие индексы лучше всего подходят для таблицы.
Я создал эти 3 индекса (100,500,1000) фиксированными, но я не знаю, являются ли они лучшими индексами для разделения моих чисел, это может быть 500, 400 или 474, кто знает.
Именно в этой ситуации я обсуждаю, как это сделать, как найти лучшие индексы, которые могут даже варьироваться , они могут быть всего 3, а могут быть 10 или N, пользователь будет иметь возможность "разделить" индексы в том количестве, которое он пожелает.
Надеюсь, теперь это имеет немного больше смысла.
Что я уже пробовал:
Одна из идей, которые у меня были, заключается в следующем, но я не уверен, что это вообще имеет смысл
Возьмем массив.Max - Array.Min и разделите результат на количество сводок, которые я хочу иметь, в данном случае 10, а затем создайте 10 различных массивов с числами в этом диапазоне и получите эти средние значения. я.е:
Array.Min = 0
Array.max = 400
Необходимые резюме = 10
Создайте 10 массивов, первый с числами, которые идут от 0 до 40, второй 40 до 80, третий 80 до 120 и так далее, а затем вычислите среднее значение каждого массива.
проблема, которую я вижу в этом, заключается в том, что у меня потенциально не может быть никакого числа в диапазоне от 200 до 300, поэтому некоторые массивы будут пустыми, и их среднее значение не будет иметь смысла?
creizlein
Спасибо всем за их вклад. Я читал о статистике, но все еще не уверен в том, какой математический подход я должен использовать.
Чтобы придать этому немного больше смысла и контекста, я пытаюсь суммировать журнал данных из автомобиля, каждый "кадр" или "запись" поставляется со значением оборотов в минуту , которое, конечно, варьируется от 0 до 8000, я получаю тысячи этих записей, и мне нужно представить их в таблице оборотов и количество попаданий, полученных каждым "фиксированным" индексом.
В практическом примере предположим, что мы получили следующие значения для обработки
{10,50,90,50,10,400,450,300,550,900,950,1100,1200,1000,900}
оборотах | просмотров
-----|---------
100 | 5 Просмотров
500 | 4 просмотров
1000 | 6 просмотров
В этом примере я как бы сгруппировал похожие числа для простоты, я действительно знаю, как вычислить хиты и выяснить, к какому "индексу" должно идти каждое значение, но сначала мне нужно выяснить, какие индексы лучше всего подходят для таблицы.
Я создал эти 3 индекса (100,500,1000) фиксированными, но я не знаю, являются ли они лучшими индексами для разделения моих чисел, это может быть 500, 400 или 474, кто знает.
Именно в этой ситуации я обсуждаю, как это сделать, как найти лучшие индексы, которые могут даже варьироваться , они могут быть всего 3, а могут быть 10 или N, пользователь будет иметь возможность "разделить" индексы в том количестве, которое он пожелает.
Надеюсь, теперь это имеет немного больше смысла.
Maciej Los
Я думаю, никто не в состоянии догадаться, как получить таблицу оборотов из вышеприведенного набора чисел.
Я бы настоятельно посоветовал обратиться к поставщику автомобилей.