Santhosh Kumar Ответов: 1

Как конвертировать pdf в pdf с возможностью поиска с помощью itextsharp в c#


Привет, кто-нибудь может сказать мне, как конвертировать pdf в pdf с возможностью поиска с помощью itextsharp или любого другого открытого исходного кода.

Заранее спасибо.

joshrduncan2012

Что вы пытались сделать для этого до сих пор?

1 Ответов

Рейтинг:
0

Sampath Lokuge

Попробуйте ниже одного.

if (File.Exists(filename))
            {
                try
                {
                    StringBuilder text = new StringBuilder();
                    PdfReader pdfReader = new PdfReader(filename);
                    for (int page = 1; page <= pdfReader.NumberOfPages; page++)
                    {
                        ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                        string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
                        text.Append(System.Environment.NewLine);
                        text.Append("\n Page Number:" + page);
                        text.Append(System.Environment.NewLine);
                        currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
                        text.Append(currentText);
                        pdfReader.Close();
                       

                    }
                    pdftext.Text += text.ToString();
                   
                }
                catch (Exception ex)
                {
                    MessageBox.Show("Error: "+ ex.Message, "Error");
                }
            }


Для дополнительной информации:

Используя iTextSharp

Я надеюсь, что это поможет вам.


Santhosh Kumar

Привет Сэмпат
Спасибо за ваш ответ
Я уже пробовал приведенный выше код, который преобразует pdf в текст, но я хочу преобразовать мой не подлежащий поиску pdf-файл в доступный для поиска pdf без каких-либо изменений в его дизайне(изображения должны отображаться как есть, а текст на нем должен быть доступен для поиска)

El Guru

Привет... У меня есть 2 вопроса, если это возможно...
1)pdfreader.close выйдет из строя ?
2)pdftext - это переменная или объект itexsharp ?
большое спасибо !! с уважением

Sampath Lokuge

Пожалуйста, попробуйте сами и убедитесь в этом. Я получил это из вышеупомянутой ссылки. Так что вы также можете посетить эту статью.