Рейтинг:
0
Sampath Lokuge
Попробуйте ниже одного.
if (File.Exists(filename))
{
try
{
StringBuilder text = new StringBuilder();
PdfReader pdfReader = new PdfReader(filename);
for (int page = 1; page <= pdfReader.NumberOfPages; page++)
{
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
text.Append(System.Environment.NewLine);
text.Append("\n Page Number:" + page);
text.Append(System.Environment.NewLine);
currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
text.Append(currentText);
pdfReader.Close();
}
pdftext.Text += text.ToString();
}
catch (Exception ex)
{
MessageBox.Show("Error: "+ ex.Message, "Error");
}
}
Для дополнительной информации:Используя iTextSharp
Я надеюсь, что это поможет вам.
Santhosh Kumar
Привет Сэмпат
Спасибо за ваш ответ
Я уже пробовал приведенный выше код, который преобразует pdf в текст, но я хочу преобразовать мой не подлежащий поиску pdf-файл в доступный для поиска pdf без каких-либо изменений в его дизайне(изображения должны отображаться как есть, а текст на нем должен быть доступен для поиска)
El Guru
Привет... У меня есть 2 вопроса, если это возможно...
1)pdfreader.close выйдет из строя ?
2)pdftext - это переменная или объект itexsharp ?
большое спасибо !! с уважением
Sampath Lokuge
Пожалуйста, попробуйте сами и убедитесь в этом. Я получил это из вышеупомянутой ссылки. Так что вы также можете посетить эту статью.