kapil koli Ответов: 2

Как скопировать PDF файл с заменой текста и редактирования


Привет,

С прошлого дня я изучаю несколько сторонних компонентов для работы с PDF через C#. Это Aspose.pdf.net и это очень круто. Ниже приведены подробности о том, для чего я их исследую:

У меня есть несколько PDF-файлов, которые содержат конфиденциальную информацию в виде текста, например имя человека, город и т. д.
Эти PDF-файлы должны быть продублированы в другую копию, но при создании дублированной копии чувствительный текст должен быть найден и заменен каким-то фиктивным текстом.
Замена необходима для того, чтобы избежать отслеживания исходной информации любыми мошенническими средствами.
Кроме того, замененный текст должен быть отредактирован.

Ожидается, что поиск текста будет поддерживать регулярное выражение, так как могут быть варианты текста, которые необходимо замаскировать.

Не могли бы вы помочь мне, как это можно сделать с помощью iTextShart.

Заранее спасибо.

Что я уже пробовал:

Я попытался изучить различные варианты с помощью iTextSharp и преуспел в дублировании PDF-файла, но пока не могу найти и заменить текст.

2 Ответов

Рейтинг:
2

Garth J Lancaster

Здесь есть небольшая дискуссия на эту тему заменить строку в PDF-документе (ITextSharp или PdfSharp) - переполнение стека[^]- показанный код может работать, а может и не работать ..

Мой подход был бы "другим" и зависел бы от того, сколько форматов документов у вас есть - обратите внимание, ни при каких обстоятельствах просто не редактируйте текст, рисуя/штампуя "черный ящик" над редактируемым текстом, потому что сам pdf-документ все еще содержит данные, и двоичная проверка может выявить детали.

Я бы разбирал весь текст из документа Чтение текста из PDF-файла на C# с помощью iTextSharp – Chris Schiffhauer[^] и создайте отредактированный документ с нуля - хорошо, мне легко это сказать, это зависит от того, насколько сложны ваши документы


Рейтинг:
0

LEADTOOLS Support

Вот еще один подход, которому вы можете следовать, если не хотите иметь текст для поиска в результирующем PDF-файле:
1-Проанализируйте текст из исходного PDF-файла и запишите прямоугольники, в которых находится текст, который вы хотите отредактировать.
2-преобразование PDF-страниц в растровые изображения.
3-нарисуйте прямоугольники редактирования на растровых изображениях, используя информацию о прямоугольниках, полученную на шаге 1.
4-сохраните полученное изображение в виде новых PDF-страниц, не содержащих исходного текста.

Таким образом, вы гарантируете на 100%, что полученный файл не содержит исходного текста.