Goran Bibic Ответов: 0

Сканирование документов в части распознавания текста PDF и стоило написать в текстовом поле с#


OCR SCAN PART PDF DOCUMENT AND WRITE VALUE IN TEXTBOX C#

Some help?   Some recommendation?   I try this but this is for all page 


Что я уже пробовал:

private void Button1_Click(object sender, EventArgs e)
        {
            using (OpenFileDialog ofd = new OpenFileDialog() { Filter = "PDF Files|*.pdf", ValidateNames = true })

            {
                if (ofd.ShowDialog() == DialogResult.OK)
                {
                    try
                    {
                        iTextSharp.text.pdf.PdfReader reader = new iTextSharp.text.pdf.PdfReader(ofd.FileName);
                        StringBuilder sb = new StringBuilder();
                       // for (int i =1; i <= reader.NumberOfPages; i++)
                        for (int i = 1; i <= reader.NumberOfPages; i++)

                        {

                                sb.Append(PdfTextExtractor.GetTextFromPage(reader,i));

                        }
                        textBox1.Text = sb.ToString();
                        reader.Close();

                    }

                    catch (Exception ex)

                    {
                        MessageBox.Show(ex.Message,"Message",MessageBoxButtons.OK,MessageBoxIcon.Error);
                    }
                }
            }
        }

lmoelleb

Начните с того, что будьте конкретны в своем вопросе. Что вы хотите взамен всех страниц? Одна страница? Раздел страницы - если да, то как этот раздел указывается? Если это одна страница и вы не знаете, как настроить этот пример, то я рекомендую вам следовать базовым учебникам C#, чтобы вы понимали каждую строку в этом простом примере - если вы понимаете, что делает каждая строка, то тривиально изменить ее на одну страницу.

Goran Bibic

Только первая страница

lmoelleb

Если вы не видите, где код зацикливается на страницах и обрабатывает их одну за другой, то вам нужно вернуться к учебникам по c# - и запустить его через отладчик строка за строкой. Копирование образцов кода из различных источников прекрасно, но всегда изучайте код и изучайте, как он работает.

Goran Bibic

Код работает, но для полной страницы. Нужна помощь для exmple rectangle ona page на определенном месте для сканирования значений, помещенных в текстовое поле. Понимаешь?

lmoelleb

Я рекомендую обновить вопрос, чтобы быть конкретным, а не просто писать комментарии здесь - почему люди должны это читать? Измените вопрос, чтобы спросить, как получить текст внутри прямоугольника в PDF, и удалите все неважные вещи, такие как обновление текстового поля, поскольку вы явно уже знаете, как это сделать (ваш исходный код сделал это). Чем более вы конкретны, тем больше вероятность, что кто-то с необходимыми знаниями сможет ответить (или даже более вероятно: вы можете погуглить его).

Goran Bibic

Нужно отсканировать от первой страницы до текстового поля указанное место 420Х120 размер прямоугольника 80х80....Что тут непонятного?

Richard MacCutchan

Это не OCR-сканирование, а чтение текста PDF-файла.

Goran Bibic

Читательский текст PDF...sory

Richard MacCutchan

Так в чем же именно заключается вопрос? Если вы знаете, как извлечь текст из всех страниц, это должно быть простым делом, чтобы извлечь его из одной страницы.

Goran Bibic

Нужно отсканировать от первой страницы до текстового поля указанное место 420Х120 размер прямоугольника 80х80....Что тут непонятного?

Richard MacCutchan

Почему вы продолжаете говорить о сканировании, когда читаете текст с помощью iTextSharp?

Goran Bibic

Ок. нужно прочитать с первой страницы pdf - документа в текстовое поле, указанное в указанном месте 420Х120, размер считывающего прямоугольника 80х80....Теперь вопрос правильно?

Richard MacCutchan

Как вы думаете, сколько еще раз вам нужно сказать, каков ответ? Если вам нужна только первая страница, то просто прочитайте первую страницу, не зацикливайтесь на всех страницах. И нет никакого способа из текстового содержимого, чтобы вы могли угадать, какой размер прямоугольника займет текст.

Goran Bibic

https://www.youtube.com/watch?v=Q_JxpGzhNqQ ... нужно это но для pdf

Зачем ты пишешь, если не отвечаешь сейчас на мой вопрос?

Richard MacCutchan

Главным образом потому, что ваш вопрос не имеет смысла. Если вы хотите извлечь данные с помощью OCR, то вы должны начать с изображение из текста. Это совершенно другая проблема, чем чтение текста PDF-файла. Поэтому следите за видео на Youtube, чтобы увидеть, как это делается.

lmoelleb

Писать заглавными буквами-это нехорошо, прекрати это. Я не знаю, как сделать то, что вы просите, поэтому я пытаюсь дать вам совет о том, как вы можете улучшить шанс того, что кто-то другой сможет вам помочь. Вы находитесь на странице вопросов и ответов, но, похоже, думаете, что это форум. Это не. Сделайте так, чтобы людям было легко помочь вам, убедившись, что фактический вопрос (а не комментарии, вопрос в самом верху) не заполнен неуместными вещами и четко определите, что вы пробовали и где застряли - с как можно меньшим количеством кода (например, вы не хотите зацикливаться на страницах, так почему же это в вашем примере кода).

Goran Bibic

Ок. нужно прочитать с первой страницы pdf - документа в текстовое поле, указанное в указанном месте 420Х120, размер считывающего прямоугольника 80х80....Теперь вопрос правильно?

lmoelleb

Нет. Похоже, вы полагаете, что используете форум. Вы не. Вы используете раздел вопросов и ответов. Вы должны отредактировать свой первоначальный вопрос, чтобы сделать его ясным, а не повторять себя в комментариях. И перестаньте писать слова заглавными буквами, это затруднит чтение. Я просто пытаюсь помочь вам понять, как увеличить шансы получить ответы на ваши вопросы. Если вы не хотите следовать совету штрафа, я думаю, что вам не важно получить ответ.

Goran Bibic

https://www.youtube.com/watch?v=Q_JxpGzhNqQ ... нужно это но для pdf

Sinisa Hajnal

Горан, ОВО ниже добро питанье, Имаш готов код, немаш погребку, а не разумиеш га.
Как сказали комментаторы выше, у вас есть все, что вам нужно в приведенном выше коде. Тем более что вам нужна только первая страница (самая простая). Снимите петлю, возьмите только 0-й индекс, и все готово.

Goran Bibic

Razumijem, ја све препарата МЮ. ОВО је код cijelu stranicu з, мені треба код за неки прямоугольник Кодзи се skenirati tacno oznaceni Дио само prvoj stranici на. Остале Ми Нису битне

0 Ответов