Coder969 Ответов: 1

Создание чат-бота, который может извлекать данные из pdf-файла


Наше приложение имеет много pdf-файлов для конфигураций. Я хочу посмотреть, смогу ли я создать приложение чат-бота для извлечения данных из pdf - файлов

Возможно ли это сделать? Любые примеры проектов будут очень полезны

Что я уже пробовал:

Поискал в интернете но не нашел ничего связанного с этим

ZurdoDev

Я не знаю, что вы искали, но вам нужно разбить его на куски. Сначала вам нужно знать, как искать pdf-файлы. Затем вы можете узнать о том, как сделать чат-бота.

Mohibur Rashid

Я собирался сказать то же самое

Coder969

Да.. Я проверяю, как искать pdf-файлы. Если какое-то решение уже присутствует, то мне будет легко сделать свой собственный чат-бот

ZurdoDev

Есть много вариантов. Просто найдите Парсеры pdf.

1 Ответов

Рейтинг:
8

Pete O'Hanlon

Как уже упоминалось в комментариях выше, вам нужно начать с разбиения большой проблемы на маленькие проблемы. Фактически, у вас есть две проблемы, которые вам нужно решить здесь: первая-как искать содержимое pdf, а вторая-Как написать чат-бота.

Давайте начнем с поиска содержимого pdf. Если бы я занимался этим, я бы посмотрел, есть ли что-нибудь доступное, что действительно может читать содержимое документа. К счастью, есть; есть любое количество услуг, таких как В Lucene[^] или Elasticsearch[^], которые обеспечивают полный текстовый поиск. Итак, одна часть решена.

Следующее, что я хотел бы посмотреть, - это то, какие ресурсы доступны мне, чтобы помочь мне научиться писать чат-бота. Чат-боты-это не то, чем вы должны заниматься без исследований или специальных библиотек, если вы не хотите сами писать системы естественного языка с нуля. К счастью, в Python есть наборы инструментов, такие как NLTK, которые вы должны иметь возможность использовать.


Coder969

Спасибо за руководство, как искать решение. Я увижу предоставленную ссылку и также попытаюсь написать scratch, если предоставленный инструментарий не решит мою цель