У меня есть файл индекса Solr/Lucene размером около 700 Гб. Документы, которые мне нужно индексировать, читаются в режиме реального времени, примерно 1000 документов каждые 30 минут, и их необходимо индексировать. В моем сценарии script запускается каждые 30 минут, который индексирует документы, которые еще не проиндексированы, поскольку требуется, чтобы новые документы были доступны для поиска как можно скорее, но этот процесс замедляет поиск.
Является ли это лучшим способом индексирования последних документов или есть другой лучший способ!