kanekhan Ответов: 1

Выделение текста в PDF с помощью C#


Привет,

Я использую приведенный ниже код для извлечения текста из pdf-файла,
public string ReadPdfFile()
{
    string strText = string.Empty;
    try
    {
        PdfReader reader = new PdfReader(@"\\FilePath");
 
        for (int page = 1; page <= reader.NumberOfPages; page++)
        {
            ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();
            String s = PdfTextExtractor.GetTextFromPage(reader, page, its);
                    
            s = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s)));
            strText = strText + s;
 
        }
        reader.Close();
    }
    catch (Exception ex)
    {
    }
    return strText;
}

Этот код возвращает весь текст с одной страницы PDF-файла, мне нужно выделить любое слово по моему выбору на этой странице PDF желтым цветом.

Есть идеи, как это сделать?

С уважением,
Кейн

1 Ответов

Рейтинг:
2

Vandana87

ПРИВЕТ,
не могли бы вы сообщить мне, где вы предоставляете текст(текст или слово, которое вы хотите найти в PDF-файле). strText пуст, и s дает вам весь pdf-контент. Пожалуйста, позвоните мне, если вы хотите найти слово в pdf hw, могу ли я это сделать. у меня есть такие значения , как номер страницы, номер слова и общее количество слов, которые нужно выделить.

Пожалуйста, направьте меня к тому же.

Спасибо.