Я прочитал несколько документов о Люцене; также я прочитал документ в этой ссылке (http://lucene.sourceforge.net/talks/pisa).
Я действительно не понимаю, как Lucene индексирует документы и не понимает, какие алгоритмы использует Lucene для индексирования?
В приведенной выше ссылке говорится, что Lucene использует этот алгоритм для индексирования:
- инкрементный алгоритм:
- поддерживать стек индексов сегмента
- создать индекс для каждого входящего документа
- введите новые индексы в стек
- пусть b = 10 - коэффициент слияния; М = 8
for (size = 1; size < M; size *= b) {
if (there are b indexes with size docs on top of the stack) {
pop them off the stack;
merge them into a single index;
push the merged index onto the stack;
} else {
break;
}
}
Как этот алгоритм обеспечивает оптимизированное индексирование?
Использует ли Lucene алгоритм B-дерева или любой другой алгоритм, подобный индексированию - или у него есть определенный алгоритм?