Noman Suleman Ответов: 0

При извлечении текста из PDF невозможно извлечь текст на урду

я извлекаю текст из PDF он имеет английский и урду текст , английский текст извлечен, как и ожидалось, но ItextSharp библиотека конвертировать урду текст в специальные символы любезно направлять меня

Что я уже пробовал:

PdfReader reader = новый PdfReader(pdfpath);

инт нумерация страниц = читатель.NumberOfPages;

for (int i = 177; i <= pageNum; i++)
{
// эта строка преобразует урду в специальный символ
text = PdfTextExtractor.GetTextFromPage(reader, i, new LocationTextExtractionStrategy());

}

С# Источник

Richard MacCutchan

Нет, iTextSharp ничего не преобразует. Вам нужно использовать правильный шрифт и набор символов для отображения символов урду.

Noman Suleman

как я могу изменить шрифт и характер ?

Richard MacCutchan

Предполагая, что PDF-файл отображает текст на урду, вы можете получить подробную информацию из этого файла. В качестве альтернативы вам просто нужно установить правильный шрифт и набор символов в вашем коде отображения.

При извлечении текста из PDF невозможно извлечь текст на урду

Richard MacCutchan

Noman Suleman

Richard MacCutchan

0 Ответов

Категории

Недавние ответы

Изменение источника данных (базы данных) программно

Проблема при попытке вставить данные: ошибка при преобразовании типа данных nvarchar в числовой.

Может ли кто-нибудь, пожалуйста, сказать мне, как я практичен в жизненном цикле страницы .NET

C# get и set ? любая помощь ценится!

Как получить список ip-адресов пользователей, подключенных к моему Wi-Fi