zequion Ответов: 2

Исходный код для индексации


Представьте, что у вас есть фраза и вы хотите индексировать слова и даже другие свойства. Например, слово "красный" также будет индексироваться свойством color. Это слишком много, чтобы просить, но это то, что я хотел бы видеть сейчас.

Если вы знаете какой-либо тип исходного кода для индексации, то я хотел бы знать. Спасибо

Что я уже пробовал:

на всех интернет-сайтах. >На всех интернет-сайтах.

2 Ответов

Рейтинг:
2

RickZeeland

Взгляните на индексацию B-дерева: B-Дерево Отсортированного Словаря[^]

Пример полнотекстового поиска: hOOt - полнотекстовая поисковая система[^]


zequion

Это двоичный поиск, а не индексный код.

phil.o

"индексный код" - это не вещь.

RickZeeland

Вы имеете в виду что-то вроде полнотекстового поиска в базе данных ?

zequion

Ну, мне было интересно, как бы создать индекс строки, чтобы иметь возможность искать слова, которые она содержит. Я работаю над полнотекстовым текстом, но не могу представить себе доступ к исходному коду чего-то похожего на Google. Если вы что-нибудь знаете, я очень заинтересован. Кстати, я пытался связаться со специалистами по лингвистике из университетов Испании, но никто не отвечает, хотя у них нет ничего похожего на то, что я делаю. Прискорбный.

phil.o

Я бы начал с основной документации:
Википедия: полнотекстовый поиск[^]
Википедия: Рейтинг[^]
Первая ссылка описывает общий процесс и предоставляет некоторые ссылки на проекты с открытым исходным кодом.
Последний, в частности, имеет дело с алгоритмом поиска Google.

Рейтинг:
1

Pete O'Hanlon

Отчасти это звучит так, как будто вы описываете создание таксономий. Например, пользователь может ввести "мусор", но таксономии для этого могут включать "мусор", "мусор", "мусор" и т. д. Но ваши таксономии также будут иметь таксономии (точно так же, как вы найдете при поиске синонимов), поэтому "мусор" может иметь "пренебрежение".


zequion

Сейчас я хотел бы выполнить некоторые функции для эффективного индексирования чего-либо, но у меня нет времени.