Baroor Ответов: 1

Как читать конкретные значения из pdf-файлов, такие как дата, имя, идентификатор электронной почты и т. д


Привет,

Как читать определенные значения из pdf-файла с помощью asp.net c#, например дата, имя, идентификатор электронной почты и т. д.

Пожалуйста помочь.
Спасибо

Что я уже пробовал:

Я попробовал какой-то код из google, но он предназначен для чтения всех значений, но мне нужны некоторые конкретные значения.

static void Main (string[] args)
{

строка pdfdata = ExtractTextFromPdf (@"report_grid. pdf");
Приставка.WriteLine(pdfdata);
Система.Приставка.Линия чтения();
}
public static string ExtractTextFromPdf(string path)
{
using (PdfReader reader = new PdfReader(path))
{
StringBuilder text = новый StringBuilder();

for (int i = 1; i <= reader. NumberOfPages; i++)
{
текст.Append (PdfTextExtractor.GetTextFromPage(reader, i));
}

верните текст.Метод toString();
}
}

OriginalGriff

Вы имеете в виду PDF-файл? Если нет, то что вы имеете в виду? "ПФО" для меня ничего не значит...
И покажите, что вы пробовали, объясните, где именно вы застряли. Это может помочь нам понять вашу проблему, и это может только улучшить ответы, которые вы получите.
Используйте виджет" улучшить вопрос", чтобы отредактировать свой вопрос и предоставить более подробную информацию.

1 Ответов

Рейтинг:
2

CPallini

Цитата:
Я попробовал какой-то код из google, но он предназначен для чтения всех значений, но мне нужны некоторые конкретные значения
Я полагаю, что это должен быть двухэтапный подход:
  • извлеките весь текст
  • извлеките из такого текста содержательную информацию