У меня есть небольшой кластер ELK, который находится в тестировании. Веб-интерфейс kibana чрезвычайно медленный и вызывает множество ошибок.
Кафка = > 8.2
Logstash = > 1.5rc3 (последние)
Elasticsearch = > 1.4.4 (последняя)
Kibana = > 4.0.2 (последняя)
Узлы elasticsearch имеют 10 ГБ оперативной памяти каждый на Ubuntu 14.04. Я забираю между 5 и 20 ГБ данных в день.
Запуск даже простого запроса, причем всего 15 минут данных в веб-интерфейсе kibana занимает несколько минут и часто вызывает ошибки.
[FIELDDATA] Data too large, data for [timeStamp] would be larger than limit of [3751437926/3.4gb]]
Эти ошибки о неудачах осколков появляются только в кибане. Согласно всем другим плагинам (head, kopf), обрезки elasticsearch совершенно прекрасны, а кластер зеленый.
Я проверил группу google, IRC и посмотрел на переполнение стека. Кажется, единственное решение - увеличить баран. Я увеличил баран на своих узлах дважды. Хотя это, кажется, исправить это на день или два, проблема быстро возвращается. Другие решения, такие как очистка кеша, не имеют долгосрочных улучшений.
curl -XPUT 'http://elastic.example.com:9200/cache/clear?filter=true'
curl -XPOST 'http://elastic.example.com:9200/_cache/clear' -d '{ "fielddata": "true" }'
В соответствии с плагином KOPF количество кучи пространства обычно приближается к 75% на полностью незанятом кластере. (Я единственный в компании, использующей его). 3 Узлы с 10 ГБ оперативной памяти должны быть более чем достаточны для количества данных, которые у меня есть.
Я также попытался настроить выключатели как предложенный в этом блоге.
PUT /_cluster/settings -d '{ "persistent" : { "indices.breaker.fielddata.limit" : "70%" } }'
PUT /_cluster/settings -d '{ "persistent" : { "indices.fielddata.cache.size" : "60%" } }'
Как я могу предотвратить эти ошибки и исправить экстремальную медлительность в кибане?
https://github.com/elastic/kibana/issues/3221
elasticsearch получает слишком много результатов, нужна помощь в фильтрации запроса
http://elasticsearch-users.115913.n3.nabble.com/Data-too-large-error-td4060962.html
Обновление
У меня около 30 дней индексов из logstash. 2x Репликация так, чтобы она составляла 10 осколков в день.
Update2
Я увеличил барабан каждого node до 16 ГБ (всего 48 ГБ), и я также обновил его до 1.5.2.
Кажется, что проблема исправлена на день или два, однако проблема возвращается.
Update3
Эта статья в блоге от эластичного сотрудника имеет хорошие советы, объясняющие, что может вызвать эти проблемы.