Member 13517891 Ответов: 2

Люсина.поиск файлов net multiple .cfs


В моем случае это не работает. Мое требование заключается в том, что сегодня я могу создать индекс для www.sample.com/page1.aspx, www.sample.com/page2.aspx страницы. Завтра я могу создать индекс для www.sample.com/page3.aspx-да. Если я ищу индекс, то поиск должен применяться на всех 3 страницах.

В этом случае, когда я ежедневно создаю индекс с новыми URL-адресами страниц, его создание файлов cfs, таких как _0.cfs, _1.cfs, _2.cfs и т. д., а также файл сегмента обновляются.

Меня тут ударили. Может ли кто-нибудь, пожалуйста, направить меня.

Что я уже пробовал:

Есть ли возможность добиться этого в моем случае

2 Ответов

Рейтинг:
1

F-ES Sitecore

Игнорируйте файлы, которые создает lucene, просто позвольте ему делать то, что он делает. Ваша проблема заключается в том, что вы постоянно добавляете новые документы. Думайте об индексе как о таблице базы данных, каждый раз, когда вы добавляете документ со свойствами, вы добавляете новую строку. Итак, в первый день ваши данные для страницы 1

ID Title
1  Hello


скажем на день, два вы изменить название на Hello World и переиндексировать, теперь у вас есть

ID Title
1  Hello
1  Hello World


Это может быть то, что вы хотите, а может и нет. Скорее всего, нет. Самый простой и дешевый способ справиться с этим-очистить документы перед индексацией

using (var writer = new IndexWriter(directory, analyzer, IndexWriter.MaxFieldLength.UNLIMITED))
{
    writer.DeleteAll();


Еще один способ, который требует больше работы,-это когда вы переиндексируете страницу, сначала найдите соответствующий документ, если он существует, поэтому вы будете искать "+ID:1". Если вы его не нашли, создайте документ и добавьте его. Если вы все же найдете его, то удалите существующие поля и повторно добавьте поля с новыми данными. Делая это таким образом, вы также получаете еще одну проблему в том, что вам нужно будет знать, когда удалять документы, когда удаляются страницы.

При работе с Lucene я настоятельно советую вам скачать Luke

Google Code Archive - долгосрочное хранилище для хостинга проектов Google Code.[^]

Это инструмент, который позволяет вам видеть, какие данные находятся в вашем индексе, просматривать документы, их поля, рейтинги, позволяет выполнять специальный поиск с помощью различных анализаторов и т. д. Вам понадобится java на вашей машине, чтобы запустить его, но он стоит на вес золота.


Рейтинг:
0

Richard MacCutchan

Вы уже разместили этот вопрос на сайте Как читать несколько файлов .cfs из lucene.чистые индексные файлы на языке Си#[^] и получил предложенное решение. Если у вас есть проблемы с этим предложением, пожалуйста, используйте У вас есть вопрос или комментарий? ссылка под опубликованным сообщением, для вашего ответа, вместо того, чтобы перепечатывать вопрос.