Member 14949846 Ответов: 2

Подсчет количества документов word, содержащих одно слово


Привет,

Используя Excel или Python, я пытаюсь определить # документов word, в которых встречается одно слово. Например, предположим, что у меня есть 100 документов word. Из этих документов я хотел бы узнать, сколько из них содержат слово "Excel" хотя бы один раз.

Мне не нужно знать, сколько раз слово встречается в каждом документе, просто если оно встречается или нет. Кто-нибудь знает, как это сделать?

Что я уже пробовал:

Я пытался найти способы сделать это в интернете, но все они содержат учебные пособия, которые требуют, чтобы я использовал их документацию, и они только говорят вам, как подсчитать количество раз, когда одно слово встречается в одном файле.

F-ES Sitecore

Если у вас есть код, который говорит, сколько раз слово появляется в файле, если счетчик один или несколько, то это результат, поэтому зациклите этот код для всех ваших файлов и подсчитайте, сколько раз вернулось в результате > 0

2 Ответов

Рейтинг:
2

OriginalGriff

Это будет сложно, так как вам нужно будет уметь читать документы Word, извлекать текст, проверять наличие экземпляра вашего word, а затем открывать следующий и повторять процесс.

Если у вас есть код для чтения файла и подсчета слов, то все, что вам нужно сделать, это повторить этот процесс для каждого файла, используя сокращенную версию вашего программного обеспечения для подсчета, которая останавливается после первого экземпляра.

Мы не можем сделать это для вас - мы понятия не имеем, какие мягкие отходы вы нашли или как это работает!


Рейтинг:
1

CPallini

Для каждого документа выполните поиск нужного слова и завершите отчет об успехе, как только найдете его. Это все.
Самая сложная часть-это как-выполнить-такой-поиск Например, если вы придерживаетесь Python а ваши цели таковы Word документы, значит python-docx[^] может помочь, см., например Как найти и заменить текст в документе Word с помощью Python - Quora[^].