Чтобы найти поврежденные файлы .pdf
Всем Привет,
У меня есть около 116222 файлов .pdf. Среди них мне нужно найти поврежденные файлы. Может ли кто-нибудь сказать мне, есть ли какое-либо программное обеспечение (бесплатное или платное), чтобы получить эти файлы, которые повреждены, или наоборот. Я много гуглил, но так ничего и не нашел. Весь результат показывает фиксирующее программное обеспечение.
Любое предложение будет очень полезно для меня.
Richard MacCutchan
Скорее всего, единственный способ сделать это-открыть каждый файл с помощью программы чтения PDF или написать собственное приложение для их анализа.
arindamrudra
Но количество файлов очень велико, вот в чем проблема.
Richard MacCutchan
Если эти файлы уже существуют на вашем диске, то вы ничего не можете сделать, не прочитав каждый отдельный файл, чтобы проверить его. Как еще можно было определить, что он испорчен?
arindamrudra
Да, все файлы есть на моем диске. Не могли бы вы взглянуть на решение OriginalGriff (очень хороший совет) и 2-е и 3-е звенья от walterhevedeich, которые также имеют высокое качество. Поэтому я стараюсь следовать этим путям.
Richard MacCutchan
Ну одна вещь, которую вы можете заметить из всех этих ссылок и предложений, заключается в том, что вам придется читать каждый файл; нет никакого возможного способа избежать этого.
arindamrudra
Да, это верно. Но если я реализую проверку "SHA hash value", то это будет очень легко. Я создам сервис, который будет вызывать файлы последовательно и будет проверяться .NET. Это займет меньше всего времени, чтобы проверить (я так думаю). Но есть график доставки, вот почему я ищу какой-то простой способ.