jmt605 Ответов: 2

Лучший способ обработки больших объемов CSV-данных?


Я новичок в кодировании и в настоящее время отвечаю за обработку больших файлов csv в форме xlsx. Данные, которые необходимо проанализировать, - это записи сведений о звонках для расследования. Я хотел бы разработать приложение для платформы Windows, которое позволило бы среднему пользователю вводить эти записи и, после обработки, отображать следующие результаты: все числа, с которыми осуществляется обмен данными, в порядке убывания, диапазоны дат и времени, которые должны быть выбраны вручную на основе временные рамки импортированной активности, с отображением всех широт и долгих координат. В настоящее время я использую для этого MS Excel и еще не получил тех результатов, на которые надеялся. Я не опытный программист, работаю над улучшением своих навыков и решил, что это будет отличным местом для начала.

Заранее спасибо....

Что я уже пробовал:

Excel, хотя я еще не понял, как автоматизировать этот процесс, как только начну анализировать имеющиеся у меня данные. Я также пытался изучить python, но не нашел достаточно простого проекта, чтобы узнать больше. Разработчик .net сказал мне, что я должен попробовать C#, но я еще не начал изучать этот язык.

Maciej Los

На такой вопрос можно ответить, основываясь на мнении. Вот почему я сообщил об этом как о чем-то постороннем.
На мой взгляд, вам следует начать изучать C#.
Щелчок здесь[^] чтобы начать поиск базы знаний CP.

Richard MacCutchan

Вы можете изучить макросы Excel, чтобы автоматизировать то, что вы хотите создать. Используйте Google, чтобы найти учебники по "Excel vba".

Maciej Los

Что ж... По своему опыту я подозреваю печальные последствия использования Excel для большого объема данных. Но, конечно, это зависит от того, что означает "большой объем данных"...

Richard MacCutchan

Правда, я использовал только небольшие и средние количества. Но, как и во многих других вопросах, здесь действительно нет полезного ответа.

Maciej Los

Правда. Вот почему я опубликовал более чем общий ответ ;)
Овации,
Мацей

Robert Welliever

На мой взгляд, если вы новичок, то лучше всего скачать бесплатную версию Visual Studio Express и запустить новое настольное приложение C#. Я справился с рядом задач, подобных вашей, и обнаружил, что использование oledb-адаптера для подключения к файлу послужит вам лучше всего. После прочтения вы можете манипулировать им в памяти как DataTable, и вы можете использовать что-то вроде DataGridView, чтобы разрешить пользователям сортировку/подкачку. Кстати, файл размером 10 МБ, о котором вы упомянули, относительно невелик. Размер не должен быть проблемой.

2 Ответов

Рейтинг:
1

jmt605

Thanks for the input so far.  The avg file size I would need to process would be between 2.5 and 10 mb.  Being a forensic examiner I read from many sources that python is a great beginner language so I am following the pack on that.  Macros seems to be the easiest solution to learn while cutting my teeth on coding "hello world" and what is your age programs.


Maciej Los

Это не ответ. Пожалуйста. удалите его, чтобы избежать голосования вниз. Чтобы оставить комментарий, используйте виджет "есть вопрос или комментарий".

Рейтинг:
0

Maciej Los

Пожалуйста, прочтите мои комментарии к этому вопросу.

Вы должны сосредоточиться на C#, если хотите иметь возможность работать с большим объемом данных, поступающих из csv-файлов. Конечно, это зависит от того, что означает "большой объем данных" в вашем случае.

Существует два - по крайней мере - способа манипулирования данными csv:
1) Использование ADO.Net[^] с Для oledb[^]
Чтение Определенных Столбцов Текстового Файла[^]
Учебник по OLE DB (C#)[^]
Много шума из-за текстовых файлов[^]
Схемы.ini-файл (текстовый файл драйвера ) | Майкрософт Документы[^]
Как добавить определение схемы в источник данных текстового файла[^]
Чтение текстового файла (txt, csv, log, tab, фиксированная длина)[^]

2) с помощью парсера
Парсер CSV файлов[^]
CSV-парсер (C#)[^]
Использование LINQ для чтения текстовых файлов с разделителями[^]